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PŘEDMLUVA. 


V této Tukovéti bylo Částečné použito mého spisu Základy statistiky, 
vydaného v Praze r, 1935, dnes rozebraného. 

Citace literatury byla omezena na nejmenU nutnou mim, též se zřete- 
lem k tomu, že nová literatura cÁzojazyČná není namnoze dosud přístupná. 

Poněvadž jsem nepovažoval za. vhodné použiti statistichjch údajfi z doby 
okupace, a nová statistická data jsou dosud pouze v malé míře k disposici, 
byly příklady, pokud se zakládají na domácím materiálu, vyhrány z vétéí 
Části ze statistických dat z doby před rokem 1938, a to opět z rUznýcli oboru 
statistiky sociální. 

Dojde-li tato rukověť statistiky, obsahující v podstatě pouze iheorii 
statistiky, zájmu též mimo okruh studujících práv, splní svůj účel. 


Cyril Horáček. 


V Praze, v červenci 1946. 


Kapitola 1. 


POJEM STATISTIKY. 


Jménem statistika se nyní nej častěji označuje vědecká methoda a 
theorie, která číselně popisuje a analysuje hromadné jevy (soubory) a zkou- 
má vztahy mezi nimi. Slovo statistika má svůj původ ve středověkém 
latinském slově status, které vedle jiných významů značilo též stát, 
a od italského slova statista, státník, což souvisí s původním významem 
statistiky jako nauky o státu (srv. historický přehled). Vytvořen byl 
tento trochu barbarsky znějící novotvar obdobně jako slova heraldika, 
numismatika a pod., a časem se vžil ve všech evropských jazycích, třeba- 
že jeho obsah se během doby často pronikavě měnil. 

Statistika je charakterisována zvláště těmito znaky: 

1. Pracuje pomocí údajů číselných, předmět statistiky musí býti tedy 
vyjádřen číselně (kvantitativně), jak vyplývá logicky z pojmu hro- 
madný jev. 

2. Předmětem statistiky jsou jevy hromadné (kolektivní) neboli 
soubory. Souborem se nazývá souhrn pozorovaných jevů (skutečností, 
událostí) stejnorodých, téhož druhu, ale různých vlastností individuel- 
ních. Soubory mohou míti nejrůznější povahu: mohou se skládati z po- 
zorování osob, na př. souhrn pozorovaných obyvatelů nějakého státu, 
žáků středních škol, pachatelů určitého trestního činu, nebo z věcí, na př. 
souhrn pozorovaných domů, bytů, zemědělských závodů, nebo z jednání 
a událostí, na př. souhrn pozorovaných trestných činů, nehod, sňatků, 
úmrtí. Jednotky, z nichž se soubor skládá, musí býti stejného druhu, 
ale nejsou úplně stejné, nebot se liší vlastnostmi (znaky) individuelních 
pozorovaných případů, na př. jednotliví obyvatelé věkem, pohlavím, 
povoláním, národností a jinými vlastnostmi, domy počtem poschodí. 
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zařízením, sňatky věkem a rodinným stavem snoubenců a pod. (srv. 
dále kap. 3.). 

Poznámka. Konkrétní, vymezené soubory, které pozorujeme (někdy se užívá 
pro soubor též názvu populace podle toho, že theorie statistiky zpočátku nejvíce 
so zabývala soubory obyvatelstva) lze považovati též za pouhé vzorky z univei-sél- 
ních pomyslných .souborů (Yule). 

Statistická methoda znamená tedy methodu souborného, kolektiv- 
ního setření, čímž se liší zásadně od methody experimentální, kterou se 
zkoumá jednotlivý jev isolovaný (na př. fysikální pokus). Statistická 
methoda je proto nej častěji používanou methodou pro poznání skuteč- 
ností sociálních, kde jde převážně o pozorováni jevů hromadných, není 
však na ně omezena, nýbrž lze jí použiti na hromadné jevy jakékoli po- 
vahy věcné, na př. biologické, antropologické, psychologické, meteorolo- 
gické atd. 

Vzhledem k tomu sluší považovati statistiku za vědu formální nebo 
metliodologické povahy, která je charakterisována jednotném způsobem 
kolektivního pozorování hromadných jevů (zvláštnost neetické methody). 
Naproti tomu materiální výsledky statistiky, poznatky získané stati- 
stickou methodou na hromadných jevech některého věcně vymezeného 
oboru, na př. hospodářský cli, tvoří spolu s ostatními poznatky, získanými 
jinými metliodami neetickými, součást nauky, která se zabývá jevy 
hospodářskými, t. j. národního hospodářství. Pokusy konstruovati tako- 
vou materiální vědu statistickou, která by obsahovala veškeré poznatky, 
získané statistickým pozorováním hromadných jevů, třeba by se ome- 
zovala pouze na hromadné jevy sociální, (ačkoli takovému omezení 
schází též logické odůvodnění), nutně skončily nezdarem.^) 

Si^or o povahu statistiky souvisící s vývojem statistiky, vyvolal 
zejména v 19. stol. celou rozsáhlou literaturu, a lze jej nyní považovati 
za vyřešený ve smyslu výše uvedeném, jakkoli se dosud vyskytují autoři, 
považující statistiku za vědu povahy věcné (materiální), omezujíce ji 
pouze na soubory jevů společenských a definující jí jako vědu o hromad- 
. ných jevech společenských a o poznatcích, získaných soustavným čísel- 
ným pozorováním těchto souborů. V české literatuře statistické byl tento 
směr zastáván Dobroslavem Krejčím. 

') O to se pokusil zvláště na poěatkn 20. stol. německý statistik Georg v, Mcyr^ 
který se snažil vybudovat! celou soustavu poznatků, získaných statistíckcii metho- 
dou v oboru společenských jovii, vo svém díle Statistik und Cesekchaftslohre 
(Tubingen 1914 — 1922, vyšly však pouze tri díly Theoretische Statistik, Bevólke- 
rungsstatistik, MoraJstatistik). 
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Slovem statistika označuje se však nejen theorie a methoda stati- 
stická, nýbrž v obecné mluve často též výsledky různých statistických 
šetření, empirická čísla, vzniklá pozorováním nějakého souboru, upra- 
vená v tabulkách nebo v jiné formě. Tak se na pr. pod označením sta- 
tistika populační rozumí nejen methoda, kterou pozorujeme soubory 
populační a nauka o této methodě, nýbrž i číselné údaje o stavu a pohybu 
obyvatelstva. Někdy se jménem statistika označuje i sama činnost sta- 
tistická, t. j. provádění nějakého statistického šetření. 
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Kapitola 2, 


STRUČNÝ PŘEHLED DĚJIN STATISTIKY. 


V tomto přehledu vývoje statistiky máme na zřeteli vývoj statistiky 
jako vědy a nepřihlížíme k úkonům, kterými si opatřoval stát určité čí- 
selné znalosti k účelům správním, zejména k potřebě vojenské a finanční. 
Takové soupisy o některých faktech důležitých pro správu státní byly 
pořizovány již za starověku všude tam, kde některý národ dosáhl vyššího 
stupně kultury a organisace, jak o tom máme zprávy z Číny, kde již 
ve třetím tisíciletí před Kristem konaly se soupisy obyvatelstva, podobně 
ve starém Egyptě a Athénách. V Římě se konaly každých pět let censy, 
při nichž byl zjišťován počet římských občanů, sloužící v prvé řadě úče- 
lům branným a finančním. Starý zákon obsahuje ve 4. knize Mojžíšově 
(kap. 1 — 4) zprávu o sčítáni mužů izraelských, způsobilých k boji. 

1. Statistika jako nauka o státu. 

Původní význam statistiky byl: všeobecná nauka o státě, zvláště 
o tom, co je důležité pro řízení státu, což se někdy též označovalo jako 
nauka o státních znamenitostech. Skutečnosti, které zejména zajímaly 
státníky, byly forma státní, obyvatelstvo, finance, branná moc, loďstvo 
atd. Na tento význam statistiky ukazuje též již zmíněná etymologie, 
statistika znamenala popsání přítomného stavu státu po všech jeho 
stránkách. 

Za spisovatele statistického v tomto významu lze považovat! již 
Aristotela (spis Politeiai); vlastní zástupci tohoto směru vystoupili na 
počátku nového věku zvláště v Itálii a potom v Německu, jako t. zv. 
universitní škola německá. 
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Poznámka. Zmínění italští spisovatelé byli: Sansovino (1521 — 1586, spis Del 
governo e amministraziono di diversi regni e republiche) a Bolero (1540 — 1017, 
spis Le relazioni wnivorsali). Díla tato obsahují popis evropských států a jejich 
zřízení. Podobná díla vydali ve Francii Pasquier (1529 — 1616, spis Recherches 
do la France), a v Německu SecJcendorf (1626 — 1692, spis Teufcschor Fiirstenstaat), 
a jiní. Z ěoských spisovatelů bjdo by lze sem zařaditi spis Pavla Stránského ze Záp 
(1583 — 1657) Res publica Bohomiae (vyd. 1634). 

Jako jednoho z prvních profesorů, který tuto nauku na universitě 
přednášel, lze uvésti Herrrruinna Conringa v Helmstádtu. Jeho přednášky 
obsahovaly pod názvem Notitia rerum publicaruna popis státu po všech 
jeho stránkách, nauka se blížila obsahem pojmu dnešního politického 
zeměpisu. 

Conring sám nenazval sice tyto přednášky statistikou, tohoto ozna- 
čení se však brzy potom počalo užívati všeobecně k označení podobných 
přednášek, které byly konány na universitách německých v 17. a 18. stol. 
v souvislosti s učením merkantilistickým, jež se tehdy v Evropě uplatňo- 
valo. Tato disciplina byla zdokonalena zejména Gottjriedem Ackenwah 
lam (1719 — 1772), profesorem v Góttinkách, který je nazýván též „otcem ^ ' 

statistiky^, hlavně proto, že dal nauce o státních znamenitostech jméno 
statistika, dále poněvadž zavedl do této nauky přesnější systém a získal 
jí známosti v širších kruzích. Achenwallovo hlavní dílo, rovněž rázu 
popisného, bylo: Abriss der neuesten Staatswissenschaft der heutigen 
vornehmsten europtiischen Reiche und Republiken. 

Ze zástupců tohoto směru statistiky, nauky o státě v 18. stol. vynikl 
zejména Ludvik Schlozer (1735 — 1809), Achenwallův žák a nástupce na 
universitě v Góttinkách, Schlozer pokusil se vymeziti pojem státních 
znamenitostí, a to v tom smyslu, že nazval tak ony jevy, ve kterých 
tkvěla síla nebo prameny státní moci, tedy zejména rozlohu státního 
území, obyvatelstvo, zemědělství, obchod, průmysl, obchodní loďstvo, 
branné síly atd. 

Poznámka. Na tomto místě lze ještě uvésti jména Busching (1724 — 1793) a 
Crome (1753 — 1833), kteří při svých popisech soudobých států používali do jisté 
míry téŽ Číselných údajů (na př. o obyvatelstvu). 


II. Političtí aritmetikové. 

Jako druhý směr statistiky vedle školy o státních znamenitostech 
vznikla v Londýně v 17. stol. t. zv. škola politických aritmetiků. Nej- 
významnějšírai jejími zástupci byli John Grattni a William Peity. Jejich 
práce se zabývaly číselným pozorováním některých jevů sociálních, ze- 
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jména populaénich, byly tedy po stránce methodické bližší nynějšímu 
pojetí statistiky. Graunt (1620 — 1674), svým povoláním obchodník a 
samouk, napsal dilo Natural and politi cal Observations upon the Bills of 
Mortality, zabývající se populačními poměry Londýna, již tehdy vellíOr 
města. Opíraje se o záznamy pohybu obyvatelstva, třeba nedokonalé, 
pokoušel se odhadnou ti počet a vzrůst obyvatelstva londýnského. 

Grauntův přítel Pelíy (1023 — 1687), který byl akademicky vzdělán, 
byl původcem slova politická aritmetika, jak se nazývá též jeho spis 
(Political Aiithmetic), jehož předmět jest rovněž populace londýnská a 
anglická. 

Nedostatek těchto prací se zakládal hlavně na nedostatečném sta- 
tistickém materiálu, který byl jim podldadem. 

Jiným vynikajícím zástupcem této školy byl anglický astronom 
Halley (1656 — 1742), který na podkladě populačního materiálu města 
Vratislavě, zpracovaného vratislavským farářem Kašparem Neitman- 
nem, sestrojil první tabulky úmrtnosti. 

V té době počala se tato politická aritmetika zabývati též jevy hospo- 
dářskými. Tu možno uvésti aspoň jména: Gregory Ring (1648 — 1712) a 
Sir Charles D'Avena7it (1656 — 1714) v Anglii, a známého francouzského 
státníka Vaubana (1633^ — 1707, spis Projet ďune dixme royale). 


III. Další vývoj statistiky až do 10. stol. 

Konec 17. století a století 18. znamená též intensivní badání z oboru 
počtu pravděpodobnosti. Z četných matematiků budiž tu uveden pouze 
Jacques Bernouilli (1654 — 1705), od něhož pochází t. zv. theorém Ber- 
nouilliho (dílo: Ars coniectandi). Tento počet pravděpodobnosti byl pak 
zdokonalen řadou matematiků, zvláště írancouzských, z nichž uvádíme 
jména i odjinud známá: Laplace, Poisson, Gauss, ďAlembert, 

Významným dílem, které možno nazvati statistickou studií v ny- 
nějším slova smyslu, jest spis Jana Petra SilssmiJclia (1707 — 1767), 
pastora v Berlíně: ,,.Die góttliche Ordnung in den Veránderungen des 
menschlichen Geschlechts, aus der Geburt, dem Tode und der Fortpflan- 
zimg desselben erwiesen" (1741), v němž zpracoval tehdejší již dosti 
přesný Statistický materiál pruských provincií. Spis ob.sahuje též pokus 
o sestrojení úmrtních tabulek pro některé tehdejší státy. Na základě 
zkoumání úmrtnosti a jejích příčin, poměru pohlaví novorozených dětí 
atd., dospěl k poznání některých pravidelností ve vývoji obyvatelstva, 
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které na ného působily tak mocným dojmem, že viděl v nich řízení božské 
prozřetelnosti, která tímto způsobem viditelně zasahá do osudů lidstva. 

Přes to, že spisy politických aritmetiků a zejména dílo Sůsamilchovo 
ukázalo statistice nové cesty, a přes to, že polaacující zdokonalení státní 
administrativy poskytlo statistice též nezbytný podldad, statistický ma- 
teriál, přece vývoj nebyl ještě jednoduchý, neboť proti sobě stály velmi 
nevraživě obě školy, jednak směru Achenwall-Schlózerova, jednak Škola 
statistiků, kteří používali ve svých studiích údajů číselných, sestavova- 
ných v tabulky (odtud nazýváni byh od německých statistiků Tabellen- 
statistiker nebo posměšně Tabellenknechtc), a spor tento se táhl až do 
počátku 19. století. 


lY. Moderní statistika. 

Za zakladatele moderní statistiky bývá považován Adolphe Jacques 
Quélelet (1796 — 187-1), ředitel ob.servatoře v Bruselu, první president 
centrální statistické komise belgické. Qučtelet napsal velkou řadu sta- 
tistických prací, z nichž buďtež jmenovány jen některé význačnější, 
a zároveň to, co nového Quételet do statistiky přinesl. Ve své knize 
Recherches statistiques sur le Royaume des Pays-Bas (1828) přidržuje 
se ještě v zásadě metody školy Achenwallovy, nový jest však jeho po- 
žadavek, aby statistika snažila se vysvětliti jevy, které pozoruje, tedy, 
aby podle vzoru ved přírodních hledala příčinné vztahy mezi jevy sociál- 
ními. Vycházeje svým školením ze věd přírodních (byl původně astro- 
nomem), hledal v jevech společenských podobné zákony, jako zákony 
přírodní řídí přírodní jevy. Tyto snahy se objevují zvláště v největším 
díle Quételetově „Sur Thomme et le développement de se.s facultés ou 
Essai de physique sociále^. 

Quételet pevně určil předmět statistiky, hromadné jevy sociální, 
převzav metody k jejich zkoumání v podstatě od politických aritmetiků. 
Odtud nazývá se též otcem moderní statistiky. Pravidelnosti, které se 
objevují při statistickém zkoumání hromadných jevů sociálních, Quéte- 
let přeceňoval hlavně v důsledku toho, že neměl k disposici statistický 
materiál dosti dlouhodobý; další práce rázu spíše antropometrického 
vedly jej ke konstrukci „průměrného člověka^ (homme moyen), který 
měl vyjadřovat! jakousi personifikaci průměru (střední hodnoty) fy- 
sických i duševních vlastností příslušníků svého národa, a ke snaze 
o řešení problému svobodné vůle člověka pomocí statistiky ve smyslu 
de ter minis ti ckém , 
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Po Quételetovi, od dnihé poloviny 19. stol., vyvíjela se statistika 
jako nauka o hromadných jevech. Úplné jednoty o pojmu statistiky ne- 
bylo však dosaženo, a dosud se vyskytují ve statistické theorii směry 
odlišné, různící se zejména v tom, zda zdůrazňují více formální nebo 
materiální stránku statistiky. Krajním směrem je t. zv. matematická 
statistika, která považuje statistiku za zvláštní případ použité (apliko- 
vané) matematiky, nedbajíc toho, že statistika není naukou abstraktní, 
nýbrž empirickou. 

Zdokonalením a zjemněním statistických method se velmi rozšířilo 
jejich používání v různých oborech vědních. K tomu přistoupilo ještě 
zvýšené použití statistické metliody na jevy společenské, zejména hospo- 
dářské, pro které je statistická methoda nepostradatelná. Kdežto druhá 
polovice 19. stol. s převládajícím liberalismem politickým i hospodářským 
nebyla příliš příznivá statistickým šetřením a v důsledku toho ani sta- 
tistickému badání, znamenají poslední tři desítiletí podstatnou změnu 
názorů na úkoly státu na poli sociálním a hospodářském ve směru daleko- 
sáhlých zásahů státu do života občanů ve všech oborech. Ve všech státech 
byla uskutečněna ve větší či menší míře rozsáhlá opatření sociálne- 
politická i pronikavé zásahy státu do výroby, distribuce i spotřeby, 
takže přítomné období národního hospodářství bývá charakterisováno 
jako hospodářství řízené. Všechny tyto úkoly státu vyžadují, aby po- 
měry populační, hospodářské a sociální byly objasněny co nejvíce a co 
nej podrobněji jako předpoklady pro státní politiku (srv. hospodářské 
plánování) a stejně i účinky zásahů státu do těchto poměrů. Přitom 
připadá hlavní úkol statistice a odtud její zvýšený význam, ovšem též 
zvýšené nebezpečí jejího zneužití. 

Literatura ke kapitole 1 — 2: České systémy a učebnice statistiky: J. Beneš 
O statistice (1920), D. KrejM Základy statistiky zvláště pro zemědělce a družstev- 
níky (2. V 3 'd. 1923), St. Kohn Základy theorie statistické methody (1929), O. Horá^ 
lek Základy statistiky (1936), J , Janko Jak vytváří statistika obrazy světa a života 
(T. díl 1942, IT. díl 1944). Dálo učebnice vj^značného angrlickóho statistUta Yule-a 
Úvod do theorie statistiky v českém překladu Dr. V. Nováka a J , Mráze (1926). 
K dějinám statistiky: Weslergaard Contribution.s to the history of Statistice, 
Londýn 1932. 
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Kapitola 3. 


LOGICKÝ PODKLAD STATISTIKY. 


I. Pojem statistického souboru. 

Pojem jevů stejnorodých, stejného druhu, na němž se zakládá sta- 
tistický soubor, který je vlastním předmětem statistiky, je pojmem 
pouze relativním. Zakládá se na abstrakci od rozdílných vlastností 
(znaků) individuálních, obsažených v jednotkách, z nichž se soubor 
skládá. Širší nebo užší měrou abstrakce, které použijeme, rozšiřuje se 
nebo zužuje též statistický soubor, ovšem čím je širší mez abstrakce, tím 
se stává stejnorodost (homogenita) souboru pochybnější. Povahou sta- 
tistiky je dáno, že netvoří vždy samostatných definic pro pojmy jevů, 
které jsou předmětem statistického šetření, nýbrž že obvykle přejímá 
pojmy už hotové, vytvořené jinými vědami, na př. pojmy Čech, země- 
dělec, vystěhovalec, výroba, spotřeba, důchod, průmyslový podnik a 
pod. V důsledku toho nelze tjdo pojmy měniti a soubor rozšiřovat! nebo 
zužovati libovolně, nýbrž toliko vybíráním a připojováním dalších znaků, 
které lze statisticky zachytiti, na př. k pojmu vystěhovalec můžeme při- 
pojiti znaky: mužského pohlaví, české národnosti, římsko-katolického 
vyznání, povolání zemědělského atd. Tímto omezováním (zužováním) 
tvoříme z celkového souboru soubory dílčí. Čím více tímto způsobem 
soubor omezujeme, tím se stává stejnorodějším, avšak tím se zároveň 
zmenšuje jeho rozsah. Z povahy hromadného jevu však vyplývá, že se 
soubor musí skládati z velkého počtu případů (jednotek), jak to pak vy- 
jadřuje pravidlo zvané zákon velkého čísla. 

Soubor musí býti vymezen vécné dříve než se počne konati stati- 
stické šetření, srv. kap. 5. 


2 Rukověť statistiky 
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Pokud jde o časové vymezení souborů, rozeznáváme dvojí druh sou- 
borů: Soubory jevů trvalých, v čase rozložených (ovšem trvání jejich 
je pouze omezené a tedy též jen relativní, neboť jednotky souboru časem 
zanikají a jiné do něho vstupují). Soubory tyto lze statisticky zachytiti 
v jedinou dobu, theoreticky v jediný okamžik, na př. soubor obyvatelstva, 
soubor závodů zemědělských a pod. (dobře věc vystihuje německý termín 
Bestandmassen). Jiný druh souborů jsou soubory jevů okamžitých, udá- 
lostí, jejichž trvání je omezeno na okamžik, a které jsou statisticky za- 
chycovány nepřetržitě během určitého časového období, na př. soubor 
úmrtí zachycován je nepřetržité během jednoho roku (německý termín 
je Ereignismassen). 

Soubory musí být! dále vymezeny místně, na př. státním územím, 
na němž je rozložen soubor obyvatelstva, obvodem města, v němž je 
rozložen soubor domů; není-li místně vymezen jiným způsobem, bývá 
určen místním obvodem kompetence orgánu, který statistické šetření 
podniká. Podle povahy souborů tvoří se pak případně přirozená vyme- 
zení místních souborů, na př. přirozené oblasti rovinaté nebo hornaté, 
oblasti přímořské, bezlesé, štěpní, nebo vymezení hospodářská, na př. 
oblasti zemědělské se stejnými podmínkami pro výrobu zemědělskou, 
městské aglomerace a pod. 

Poznámka. Zcela konkrétně můžeme si představiti statistický soubor jevů 
ti*valých: ulehneme-li za letního dne do stínu košaté vzrostlé lípy, vidíme v její 
koruně statisíce listů, které všechny jsou téhož druhu, téže podoby, charakteristic- 
kého srdčitého tvaru. Přihlédneme-li však blíže k jednotlivým listům, sotva bychom 
našli dva listy úplně se shodující co do délky, šířky, rozměrů vroubkování, použijo- 
me-li jemných měHtek srovnávacích. Listy téhož stromu jsou všechny jednoho 
druhu, ale různých vlastností individuálních. 

Ovšem můžeme též považováti tuto lípu za náhodně vybraný vzorek ze 
všech lip toho druhu rostoucích po zemělcouli, t. j. myšleného universálního 
.souboru všech existujících lipových listů. 


II. Poměr statistické mcthody k indukci. 


Jestliže můžeme methody vedoucí k našemu poznání, methody 
neetické, rozdeliti na dvě hlavní skupiny: 

^ . . (^Methodu deduletivní neboli spekulativní, která se snaží ab- 

h- ridii gtraktními logickými pochody dospěti k poznání; 

/O,' ^^Methodu induktivní v nejširším slova smyslu neboli empirickou, 

Héhfííí která na základě zkoumání skutečností se snaží dospěti k všeobecnému 

' poznání, od poznání jednotlivostí dochází se k úsudku o celku, potom 
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statistickou methodu zařadíme do skupiny druhé, poněvadž také při ní 
vycházíme od pozorování jednotlivých jevů a od tohoto pozorování 
docházíme k úsudku o celku, statistickém souboru. 

Statistickou methodu je však považovat! za zvláštní druh úsudku 
indukčního. Schematicky mohli bychom si věc představit! takto: 

Pozorujeme-li opětovně, že určité podmínky, které označíme pís- 
meny A, B, Gf mnohokráte vedly k témuž důsledku, označenému pís- 
menem Z), mluvíme o úsudku indukčním, podle něhož usuzujeme, že 
kdykoli se vyskytne A, B, O, vždy bude následovat! B. Druh těchto 
vztahů snažíme se pak dále zkoumati v tom směru, zda jde o příčinnou 
závislost (kausalitu). Jestliže máme dva členy S T spojené v úsudku 
o témže jevu, vyjadřujeme při indukčním úsudku podmíněnost obou 
členů ve formě: jestliže je >8', je i T. 

K rozhodnutí otázky, který z obou jevů ^ a ÍT je podmínkou a který 
důsledkem, slouží dvě kriteria: výskyt jevu S je podmínkou jevu T, 
jestliže výskyt jevu S pravidelně s sebou přináší výskyt jevu T, avšak 
nikoli naopak, a jestliže v Časovém sledu výskyt jevu S předchází vý- 
skytu jevu T. Zvláštním případem je vzájemná příčinnost obou jevů, 
jestliže i jev S podmiňuje jev T, i jev T podmiňuje jev S, 

Tento úsudek však předpokládá, že známe veškeré podmínky a 
veškeré důsledky, které jim následují. Pouze v tomto případě lze užiti 
obecné methody indukční, umožňující nám objasnit! příčinný vztah. 
Naproti tomu všude tam, kde nejsou známé bud veškeré podmínky nebo 
veškeré důsledky nebo obojí (tak tomu bude pravidelně u jevů sociál- 
ních), nutno použiti methody statistické, která se zakládá na logickém 
postupu poněkud odlišném. 

Schematicky můžeme si v takovém případě označiti podmínky 
písmeny A, By G -\- X, kde X znamená jednu nebo i více podmínek 
neznámých, výsledný jev pak písmenem Í> -f- P, kde Y značí opět jeden 
nebo více důsledků neznámých. 

Kdežto methoda indukční umožňuje založiti konkluse na jediném 
pozorování nebo experimentu, který ovšem se může libovolně opakovati, 
a může poskytnout! závěr o příčinné souvislosti, statistická methoda se 
zakládá na hromadném pozorování a poskytuje konkluse toliko o pravdě- 
podobných souvislostech. Úsudek zakládající se na statistické met hodě 
je tedy považovat! buď za zvláštní druh úsudku indukčního (někdy se 
též mluví o neúplné indukci) nebo za samostatný postup noetický, za- 
kládající se na zvláštním pochodu logickém. 
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Příklad. Mebhody íiidukčaí lze užífci na objasnění nějakého jovu fysikálniho, 
na př. volného pádu hmotného tělosa, jenž nastává vždy,.uvolnime-íi je a jenž se 
řídí pravidlem, že dráha, kterou těleso urazí, jo úměrná dvoj moci ěasu, po který 
těleso padá. Naproti tomu nelze předem urči ti pohlaví novorozeného dítěte v kon- 
krétním případě, nýbrž toliko pravděpodobnost rozložení pohlaví mnoha novoroze- 
ných dětí na základě předcházejícího pozorování methodou statistickou. 

Mohli bychom se postaviti na stanovisko: Kdybychom nebyli ne- 
vědomí. nebylo by pravděpodobnosti, nýbrž toliko jistota. Ovšem ani 
naše nevědomost není absolutní, my něco o jevu víme, jinak by nebylo 
ani pravděpodobnosti. Pojem pravděpodobnosti souvisí takto s naší 
nedostatečnou znalostí věcí (Henri Poincaré). 


líl. Pojem pravděpodobnosti. 


Logický pojem pravděpodobnosti je v úzké souvislosti s formou 
hypoteticko -disjunktivního úsudku. Schéma hypoteticko -disjunktivního 
úsudku zní; Na praemissu A může následovati konkluse B nebo C nebo D 
nebo X. Tedy kdykoli nastane A, nastane s určitostí jedna z těchto kon- 
klusí, praemissa A jest k úhrnu těchto konklusí v poměru nutnosti, avšak 
k jednotlivým konklusím (totiž B nebo G nebo D nebo X) pouze v po- 
měru možnosti. Úkolem počtu pravděpodobnosti jest pak vyšetříti stupeň 
této možnosti. 


Chceme-li tedy zjistiti stupeň možnosti, že nastane jev B, předchází- 
li jev A, a je-li znám celkový počet všech možných, ale vzájemně se vy- 
lučujících jevů, které mohou následovati, a ona část možností, která 
jediná vede k očekávanému jevu B (jinak vyjádřeno: je příznivá jevu i?), 
pak poměr obou těchto veličin dává nám vzorec matematické pravdě- 
podobnosti, že nastane B. Tento poměr se vyjadřuje zlomkem: 

počet případů příznivých , . i. . , x. tt . 

rr — — r-T— a nazvva se pravděpodobnosti. V theoru sta- 

pocet připadli možných 

tistiky se označuje matematická pravděpodobnost obvykle písmenem p 
(probabilitas), jehož bude nadále užíváno. 

Krajní mez této pravděpodobnosti je jednak případ, kdy nevysky- 
tuje se žádný případ příznivý, pak i pravděpodobnost í? ^ 0, mluvíme 
o nemožnosti toho, že by se případ B mohl vyskytnout! . Jestliže naopak 
všechny případy možné jsou zároveň případy příznivými, pak pravdě- 
podobnost p = 1, nastává druliá mez, mluvíme o jistotě, že případ B 
se vyskytne. Konečně lze vytknouti ještě případ střední, kdy počet 
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případů pro jev B příznivých je stejný jako počet případů pro jev B 
nepříznivých, pravděpodobnost ^ což se někdy nazývá pravdě- 

podobností v užším smyslu. 

Příklady takové pravděpodobnosti poskytují zvláště t. zv. hry 
náhodné, jako jsou kostky, loterie, ruleta, vrh penízem a pod., t. j. 
takové hry, kde Činnost jako hod, tah a pod. může vésti k několika vý- 
sledkům, jejichž pravděpodobnost je předem stanovena. Na př. u kostek 
pravděpodobnost, že padne určitá stěna s určitým číslem, rovná se 

p — poněvadž je šest stěn a tedy šest případů možných, u vrhu 
mincí pravděpodobnost, že padne líc nebo rub p = atd. 

Poznámka. Pokud jde o výklad a odvození několika základních pravidel 
počtu pravděpodobnosti, pravidla o sčítání pravděpodobností, očekáváme-Ii alter- 
nativní výsledek, pravidla o násobení pravděpodobností, očekáváme-li současné 
vyskytnutí několika jevů, pravidla o násobení pravděpodobností při jevech na 
sobě závislých, poukazuje se na učebnice algebry používané na vyšších středních 
školách a příklady v nich uvedené. 
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Kapitola 4. 


THEORETICKÉ ROZLOŽENÍ SOUBORU 
A ZÁKON VELKÉHO ČÍSLA. 


1. Binomické rozložení. 


Vedle všeobecné pravděpodobnosti, že určitý jev nastane za urči- 
tých předpokladů, jde ještě o to, určiti pravděpodobnost toho, že určitý 


jev se bude opakovati v určitém počtu při daném množství pozorováni. 


Označí me-li pravděpodobnost toho, že jev A nastane písmenem p, 
pravděpodobnost, že nastane jev B, písmenem q (při čemž ^4 a .S se vzá- 
jemně vylučují a dohromady vyčerpávají všechny možné případy, tedy 
p + gr = 1), počet pozorování označíme písmenem w, a konečně písme- 
nem m počet výskytů A, který očekáváme při tomto počtu pozorování, 
potom pravděpodobnost, že jev A se mkráte vyskytne při n pozorování, 
je dána vzorcem : 



při čemž symbol í 1 značí zlomek 
\m) 


n.{n^ 1) (w — 2)(n — 3). .(n — m -fl) 
1X2X3X4X...W 


Příklad ě. 1. Je dána urna se stejným počtem koulí červených a čer- 
ných (třeba 5 a 5). Pravděpodobnost, že se při jednom tahu vytáhne 

koule červená, rovná se tedy p = Pravděpodobnost, že nastane druhý 

jedině možný jev, to je, že vytáhneme kouli černou, rovná se rovněž 

^ Pravděpodobnost pak, že při deseti tazích vytáhneme pět koulí 
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červených, dána je vzorcem výše uvedeným, kde dosadíme: 




n = 10, w = 6, 

10x9x8x7x6 


1 X2x3x4x5 


<(irx(ir=..- 


Za stejných předpokladů je pravděpodobnost, že při deseti tazích 
vytáhneme osm koulí červených: 




X9x8x7x6x5x4x 


X2x3x4x5x6x7 X« 
45 


Mirx(4r= 


1024 


= 0,0439. 


Sestavíme-ii pro týž příklad tabulku, ve které jsou vyznačeny veš- 
keré pravděpodobnosti pro všechny případy opakování očekávané udá- 
losti, tedy pravděpodobnosti, že vytáhneme 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 až 
žádnou kouli červenou při deseti tazích, Čili pravděpodobnosti pro vše- 
chny hodnoty m od tz. až do nuly, dostaneme theoretické rozložení četností 
pravděpodobnosti čili t. zv. rozložení binomické. 

Poznámka. Toto pravidlo se nazývá též zákon binomický, poněvadž hodnoty 
pravděpodobností po sobě následující představují po sobě jdoucí členy rozvoje 
binomu (p + 

Tabulka pravděpodobností vypočtených pro příklad č. 1. 


Výskyt jevu A 

Odchylka od normál- 
ního případu, t. j. 

5 koulí červených a 

5 koulí černých 
v sérii deseti tahů 

Pravděpodobnost 
výskytu A 

10 červených koulí 

+ 5 

0,0009765625 

9 

+ 4 

0,0097656250 

8 

-h 3 

0,0439453125 

7 ,, ,, 

+ 2 

0,1171875000 

0 ,, 

+ 1 

0,2050781250 


0 

0,2460937500 

4 

— 1 

0,2050781250 

3 a 

— 2 

0,1171875000 

O 

•• j> *} 

— 3 

0,0439453125 

1 >> 

— 4 

0,0097656250 

0 

— 5 

0,0009765625 


1,0000000000 
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Binomické rozložení pravděpodobností ukazuje v tomto případě obraz 
zcela S 3 rmetrický. V případech však, že p není rovno q, je rozložení a syme- 
trické, při čemž se však stává tím souměrnější, čím více serie vzrůstají. 

Vezmeme-li pravděpodobnost, že vytáhneme pět koulí červených 
a pět koulí černých, za případ normální, takový, jaký očekáváme podle 


obecné pravděpodobnosti I p —q = potom značí nám ostatní případy 


odchylky od tohoto případu normálního, jak nahoře v tabulce je vyzna- 
čeno. Pravděpodobnost jednotlivých odchylek od případu normálního je 
tím menší, čím je odchylka větší. 

Kdybychom si znázornili toto rozložení odchylek graficky, na př. 
pro 100.000 případů, násobíce 100,000 vypočtené pravděpodobnosti, ob- 
drželi bychom zvláštní křivku jedno vrcholovou a souměrnou, zvanou 

křivkou Gaussovou ípro uvedený případ, že p = ^ 


Křivka Gaussova je ideálním obrazem rozdělení četností statistic- 
kého souboru. Křivka tato je zcela souměrná, takže hodnoty po obou 
stranách osy y ležící se liší jen znaménkem, dále má tu vlastnost, že 
klesá rychle k ose úsečkové x, takže pravděpodobnost odchylky se zmen- 
šuje v poměru k velikosti odchylky, a konečně se blíží stále k ose a; (je 
asymptotická k ose x). 

Poznámka. Rozdělení odchylek podle zákona Gaussova lze zuázorniti též 
mechaniclcy přístroji Galtonovým a Pearsonovým, vyobraz, u Yule-a, cit. Český 
překlad, str. 309, nebo římskou studní, kde voda se záměrně rozděluje vždy na 
dva a další dva praménky podle schématu Schwarzo\^a {A, Schwarz: t)ber den 
Umgang mit Zahlen, Mnichov 1943, str. 35). 
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Římská studna. Schéma k demonstraci binomického rozloženi. Voda te6e 
z misky nejvýše položené dvěma stejnými praménky do misek spodních, z těch 
opět stejnými praménky do níže položených atd. Ve třetí řadě misek vytékající 

1 2 3 3 3 

voda se spojuje, — a — na -h- množství vody, a ty se opět dělí na a — r . Množství 

ooa iblo 

vody v nádobách ve spodní radě je rozděleno podle binomického rozložení. 

II. Pravděpodobnost theoretická a empirická. 

V příkladech výše uvedených šlo vždy o pravděpodobnost předem 
uměle sestrojenou, matematickou, t. j. takovou, která se dá vypocítati 
předem na základě znalosti případu a všech jeho možností. Toto theore- 
ticky V3'^poctěné rozložení pravděpodobností lze pak srovnávati se sku- 
tečnými výsledky výše uvedených her náhodných, sestavených ve sta- 
tistický soubor. 

Avšak pravidelně neznáme u souborů statistických předem oněch 
možností, které mohou nastati, nemůžeme tudíž ani vypocítati pravděpo- 
dobnost onoho jevu, který nás zajímá. Postup, který sledujeme při zkou- 
mání těchto jevů, je tedy jaksi opačný: z velkého pozorovaného souboru 
těchto jevů, u kterých se hledaná událost (znak) vyskytla, usuzujeme na 
pravděpodobnost jejich podle získané zkušenosti, empiricky. Schema- 
ticky lze to vyjádřiti vzorcem: učinili-li jsme počet n pozorování nějakého 
souboru a při nich v m případech vyskytl se onen jev, který nás zajímá, 
a jehož pravděpodobnost bychom clitěli vyšetřiti, vyjadřuje nám poměr 

7)X 

— Četnost (frekvenci) tohoto jevu uvnitř onoho souboru. Při velkém 

počtu pozorování, rozsáhlém souboru, předpokládáme, že blíží se tato čet- 
nost pravděpodobnosti theoretická, t . j . takové, jakou bychom předem theo- 
reticky očekávali, kdyby nám byly veškeré podmínky výskytu takového 
jevu známy. Toto pravidlo o vztahu velkého počtu pozorování nějakého 
jevu k theoretieké pravděpodobnosti se nazývá zákonem velkých čísel. 

Poznámku. Název „zákun velkých 5ís5eJ“ pocházi od Poie8ona (Rechcrches 
SUT la Probabilifcó des Jugements en matiěrn criminelló et en matiěre civile, 1837). 

Sama zkušenost vedla k poznání, že při velkém počtu pozorování se 
objevují pravidelnosti ve složení souborů statistických, které nelze zjistiti, 
jestliže vybereme jen jednotlivé jevy samy o sobě nebo pozorujeme pouze 
malý počet jich. Lidé dosahují věku velmi různého; někdo zemře v dět- 
ském veku, jiný v kvetu mládí, opět jiný dožije se vysokého stáří. Kon- 
krétní životní osudy samy o sobě pozorovány zdají se být i zcela nepravi- 
delné, jak říkáme náhodné, a nemůžeme z nich vyvozovati žádné úsudky. 
A přece životní pojišťovny, jejichž obchody zakládají se na pojišťování 
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pro případ úmrtí, na základě výpočtů určují pojistné prémie a ze svých 
obchodů vykazují každoročně pravidelné zisky. 

Tuto pravidelnost, známou též pod klasickým označením zákon vel- 
kých čísel, přirovnal Quételet k pozorování kružnice křídou na tabuli na- 
rýsované. Pozorujeme-K ji zblízka, rozpadá se kružnice na veliké množ- 
ství samostatných, zcela nepravidehiě rozptýlených bodů, křivka sama 
se však zcela ztrácí. Teprve odstoupíme-h poněkud, dostáváme obraz 
souvislé křivky, body splývají v jedno a ztrácejí se, a objevuje se jejich 
symetrické, pravidelné uspořádání, vidíme kružnici. 

Právě tato poměrně veliká pravidelnost a stálost, která se jeví v sou- 
borech jevů společenských, má základní význam pro různá společenská 
a hospodářská zařízení. Na základě dlouhé zkušenosti jsou založena vše- 
chna společenská zařízení na předpokladu jisté pravidelnosti a stálosti 
všech jevů. Ústavy veřejné, školy, nemocnice, trestnice, ústavy zaopatřo- 
vací vesměs jsou zařízeny jen pro jistý normální, předpokládaný počet 
osob, který se rok od roku pouze málo mění, podobně i život hospodářský 
je vypočten na jistou pravidelnost: obchodník počítá s určitým stálým 
počtem zákazníků a podle toho nakupuje a udržuje své zásoby, likvidita 
peněžních ústavů je založena na podobné pravidelnosti, státní rozpočet 
vychází rovněž z předpokladů stálosti příjmů a vydání v budoucím roce. 

Tyto jevy jsou namnoze povahy biologické, na př. četné kulturní 
formy a právní instituce založeny jsou na trvalém předpokladu, že poměr 
pohlaví u novorozených dětí zůstává stálý a drží se přibližně v rovnováze 
8 malým přebytkem chlapců. 

Příklad č. 2. Fomht j)ociu riarozených chlapců k počtu narozených 
děvčat v Československu. 

Na 1000 narozených děvčat připadalo chlapců (zaokrouhleno na celá čísla) 


r. 1920 

1079 

r. 1929 

1074 

1921 

1077 

1930 

1062 

1922 

1078 

1931 

1068 

1923 

1071 

1932 

1065 

1924 

1066 

1933 

1064 

1925 

1071 

1934 

1068 

1926 

1066 

1935 

1062 

1927 

1061 

1936 

1072 

1928 

1064 




Poznámka. Veškerá data v tomto příkladě i v ostatních příkladech uvedená 
vztahují se na území Československé republiky z počátku r. 1938. 
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Zákon velkých Čísel je potvrzován četnými pokusy konanými u t. zv. 
náhodných her, na př. při opakovaných tazích koulí z urny se stejným 
počtem černých a bílých koulí, kam se vytažené koule opět vracejí, kde 

tedy očekávaná pravděpodobnost pro každý tah pro každou barvu je 

tí 

Při 10.000 opakovaných tahů došel Westergaard k poměru tažených 
koulí podle barvy 50,lo/o a 49,9°/o. "^7^^ tahy analysoval pak blíže tím 
způsobem, že konal je v sériích po stu tazích, které pak vždy k předchá- 
zejícím přičítal, a zkoumal, jak se blíží očekávané pravděpodobnosti. 
Výsledlíy potvrdily, že poměr obou barev tím více se blížil očekávanému 

poměru pro každou barvu, čím bylo provedeno více tahů, čili čím více 

sérií k sobě přičítal, tím byly poměrné odchylky od očekávaného vý- 
sledlcu menší. 

Sestavíme-li výsledky takových pozorování, jako byla Westergaar- 
dova^ zaznamenaných podle sérií, v tabulku seřazenou podle velikosti od- 
chylek od očekávaného (normálního) výsledku (čili sestavíme-li z vý- 
sledků pozorování statistický soubor a tabulku rozložení četností), mů- 
žeme zjistiti, kolikráte se která odchylka vyskytuje, čili zjistiti četnosti 
těchto odchylek. Aritmetický průměr tohoto souboru rovná se A = ap 
a směrodatná odchylka souboru rovná se Oq = \apq (jestliže opět ozna- 
číme písmenem p očekávanou pravděpodobnost jevu A, písmenem q oče- 
kávanou pravděpodobnost jevu protilehlého a vzájemně se vylučujícího 
B a písmenem s celkový počet pozorování v sérii: srv. dále kap. o sta- 
tistických charakteristikách). 

Poměrná směrodatná odchylka, t. j. směrodatná odchylka četností 
uvedená v poměr k počtu pozorování s rovná se pak 

_£o. ^ ]/ gpg _ |/yg _ 

Z tohoto vzorce plyne, že poměrná odchylka (očekávaná) je tím 
menší, čím větší jest s počet pozorování. Výsledek pozorování bude se 
tedy tím více bHžiti očekávané pravděpodobnosti, čím je větší počet po- 
zorovaných případů, avšak nikoli úměrně s počtem pozorování, nýbrž 
todko 8 jeho druhou odmocninou. Zvýšíme- li tedy počet pozorování čtyři- 
kráte, přiblíží se skutečné rozložení odchylek očekávané pravděpodobnosti 
pouze dvakráte, stále za předj^okladu, že se neporušuje stejnorodost sou- 
boru. V seskupení odchylek kolem aritmetického průměru se objevuje 
velká pravidelnost, odchylek ubývá tím více, čím jsou větší a přibývá 
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souměrně v obou směrech, cím jsou menší. V mezích jedné směrodatné 
odchylky la leží 68,27°/o všech případů, v mezích dvojnásobné směro- 
datné odchylky 2a 95,45®/o případů a v mezích trojnásobné odchylky 3 
99,73^/^) všech případů, čili zhruba skoro všechny případy. Odtud je od- 
vozeno pro statistickou praxi důležité pravidlo, že statistické hodnoty, 
poměry a koeficienty považujeme jen tehdy za ukazatele spolehlivé, jest- 
liže převyšují aspoň trojnásobně svou theoretickou směrodatnou od- 
chylku, jinak že se pohybují v rámci náhodných odchylek (v. obrazec 
Gamsovy křivky a rozdělení její plochy). 



Všeobecně lze nazvati zákonem velkých čísel úkaz, že statistické 
soubory vykazují teprve od určité velikosti svou charakteristickou struk- 
turu, která není zřejmá u jednotek nebo u malých skupin, z nichž se 
soubor skládá. 

Matematicky lze vyjádřit! zákon velkých čísel theorémem Bernoxdl- 
liho pro případy, kde pravděpodobnost události zůstává nezměněna při 
přechodu od jednoho jevu ke druhému (na př. vytahují -li se koule z urny 
a zase se do ní vracejí, takže poměr barev zůstává při každém tahu týž), 
pro ostatní případy byl pak doplněn Poissonem. 

Tento theorém dá se v podstatě ob jasni ti slovy: 

Maximum theoretické pravděpodobnosti odpovídá maximu empi- 
rické, skutečné pravděpodobnosti, takže při dostatečně velkém počtu 
pozorování lze očekávati, že jev o největší theoretické pravděpodobnosti 
se také ve skutečnosti vyskytne nej častěji. Při počtu pozorování vzrůsta- 
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jícím (theoreticky) do nekonečna, blíží se rozdíl mezi theoretickou pravdě- 
podobností a skutečným výskytem jevu nule. 

Vzorec Laplaceúv vyjadřuje pravděpodobnost, že poměrná četnost 
(skutečné vyskytování) události se neodchýlí od matematické pravděpo- 
dobnosti této události více než o určitou veličinu, čili že se bude odchylka 
od matematické pravděpodobnosti pohybovat! v mezích daných touto 
veličinou. 

Označíme-h tuto veličinu písmenem á, je dána tato pravděpodob- 
nost funkcí vÝrazu 

/i 



kde ostatní písmena mají stejný význam jako v předcházejících vzorcích. 
Funkci tohoto výrazu lze přibližně vyjádřit! integrálem 

\ 71 

(n značí Ludolfovo Číslo 3,14159, e základ přirozených logaritmů 2,71828, 

íC 

i = , při Čemž x j e hodnota úsečky každé odchylky, měřená od středu 

yia 

symetrického rozložení). 

Poznámka. O funkčním poměru dvou veličin mluvíme tehdy, jestliže každé 
hodnotě veličiny jedné odpovídá určitá hodnota veličiny druhé. Počet infinitesi- 
mální jedná o veličinách proměnných: v diferonciálním počtu určujeme ze známé 
závislosti dvou veličin proměnných nekonečně malou změnu jedné, odpovídající 
nekonečně malé změně druhé veličiny. V počtu integrálním obráceně hledáme 
zákon, spojující obě proměnné veličiny, ze známých sobě odpovídajících nekonečně 
malých změn jejich (srv. Vojtéck: Základy mathematiky, Praha 1922, I, str. 5). 

Pro jednotlivé hodnoty veličiny u je možno použiti tabulek, aniž by 
bylo třeba vypočítávat! integrál pro každou hodnotu. Obsahuje je na př. 
cit. kniha Kohnova, str. 175. Pro přehled postačí, uvědomíme-H si, že 
hodnota pro případ, že íí = 1, 0(u) = 0,843, když w = 2, ^ 0,995, 

když u — Zy u) = 0,99998, čOi blíží se prakticky jedné celé. 

Rozložení Lapíaceova integrálu tvoří v grafickém znázornění křivku 
Gaussovu. 

Poznámka. Z výrazu u lze od voditi jiné měřítko pravděpodobnosti, 

l/ -^Pg 
• 8 
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t. zv. modul. Z uvodoného vzorce vyplývá, že odchylka = w |/ položímo-li 

« = 1, dostaneme výiaz [/ který se oznamuje jako modul a je mírou mezních 
' a 

odchylek poměrných četností očekávaných událostí od jejich theoretické pravdě- 
podobnosti. 

Je lo vlastně poměrná odchylka = ]/ , násobená ^ 2 (.srov. str. 27 a 

58 sl.). 

Příklad Č. 3. Máme li v urně čtyři koule černě a šest bílých, pravdě- 

4 

podobnost (theo tetická), že vytáhneme kouli černou p = — = 0,4, pravdě- 

podobnost, že vytáhneme bílou q = ^ — 0,6. 

Modul umožňuje nám zjistiti pravděpodobnost, že při stu opakova- 
ných tazích poměrné vyskytování černé koule j^j bude se pohybovat! 
v mezích daných modulem. 

Modul v tomto případě se rovná = ]/ 2 x 0,4 x 0,0 _ q qqq 

ř 100 

tudíž meze dány jsou hodnotami 0,4 -f- 0,069 a 0,4 — 0,069, čili tážeme 
se na pravděpodobnost, že při stu tahů bude se tah černé koule pohybo- 
vat! v mezích 0^469 a 0^331. 

Tato pravděpodobnost je dána v tabulce hodnot pro případ 
zvolený, žeu = 1, číslem 0,843. Ze sta tahů bude se tedy přibližně 84 po- 
hybovat! v uvedených mezích, ostatní tahy (16) budou tyto meze pře- 
stupovat!. 

Spolehlivost předpovědi pravděpodobného výsledku můžeme zvý- 
éiti, vezmeme-li modul dvojnásobný nebo trojnásobný (čímž ovšem se 
modul dvojnásobně nebo trojnásobně zvětšuje a tím i meze, v nichž se 
budou tahy pohybovat!), jakož i zvýšením počtu pozorování v sérii 
(čísla s). 

Vykonáme-li v uvedeném příkladě deset tisíc tahů, bude se modul 
rovnati 0,0069, meze budou pak dány hodnotami 0,4 + 0,0069, čili 0,4069 
a 0,3931, čili jsou daleko užší než v případě prvním; přesnost výsledku 
vzrůstá úměrně s druhou odmocninou počtu pozorování. 

Litftiatura ko kopilolc 3 — 4. St. Kohn, Základy theoj io statistické methody, 
W, Wundt Logik I — III, 4, vyd. Stuttgart 1919 — 1921, H. Poincaré^ La science 
et rhypothase, Paříž 1920, U. Ytde, Úvod do theorie statistiky, A. A. Čuprov^ 
Očorki po teorií statistiki, Moskva 1910, týž Gruiidbogiufí© iind Grundproblemo 
der Korrelationstheorie, Lipsko 1925. 
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Kapitola 5, 


TECHNIKA STATISTICKÉHO ŠETŘENÍ. 


Číselné údaje statistické zvané statistická data nebo statistický ma- 
teriál získáváme hromadným pozorováním, které stručně označujeme 
jako statistické šetření. Technikou statistického šetření rozumíme pak 
způsob a postup, jakým soubor zachycujeme. Statistická šetření souborů 
skládajících se z jevů trvalých bývají označována jako sčítání nebo sou- 
pis (census, na př. sčítání lidu, sčítání živnostenských závodů, sčítání 
ovocných stromů). Jimi se zjišťuje stav souboru v určitém momentu ča- 
sovém (na př. stav obyvatelstva 1. prosince určitého roku). Soubory, 
skládající se z jevů okamžitých (událostí), zachycujeme statisticky trva- 
lým (neustálým) pozorováním (registrováním) vyskytnuvších se případů 
(událostí). 

Techniku statistického šetření můžeme si rozděliti za účelem lepšího 
přehledu na tři hlavní stadia: 

1. přípravu šetření, 

2. vlastni šetření, 

3. zpracování, úpravu a publikaci získaného materiálu. 


1. Příprava statistického šetření. 

Přípravné práce ke statistickému šetření vyžadují nejprve, aby byl 
stanoven plán, podle kterého se má šetření konati. Je třeba určiti, který 
soubor chceme znáti a co na něm chceme znáti. Soubor, který chceme 
podrobiti statistickému šetření, musíme nejprve logicky pevně vymeziti, 
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definovati. Při tom je statistik obyčejně vázán pojmy, vytvořenými ji- 
nými vědami, na př. národním hospodářstvím, jde-li o soubor jevů hospo- 
dářských, nebo právními normami. Jestliže však pojmy, které takto jsou 
poskytovány, nejsou zcela jednoznačné, je třeba, aby si je statistik vy- 
mezil samostatně tak, aby bylo možno zjistiti bezpečně, zda v konkrétním 
případě je jev dán čili nic. Na př. pojem kupní síla peněz, národní dů- 
chod a pod. 

Soubor musí býti vymezen jednak časově, jednak místně. Pokud jde 
o čas, musí býti stanovena kritická doba, kdy se má konati šetření sou- 
borů jevů trvalých, nebo musí býti stanoveno časové období, interval, 
průběhem kterého se má soubor pozorovati, při souborech jevů okamži- 
tých. Pokud jde o místo, musí býti stanoveno území, na které se má šet- 
ření vztahovati. 

Věcné vymezení souboru děje se prakticky vymezením jednotky 
statistického šetření, ze kterých se pozorovaný soubor skládá a na které 
jest jej třeba rozložití. 

Jednotkou šetření, ze kterých se skládá soubor, hi'omadný jev, je 
na př. při sčítám hdu individuum (jednotlivý obyvatel), při sčítání živ- 
nostenských závodů technické a výrobní zařízení, které jest definováno 
jako živnostenský závod. Někdy může býti při jednom šetření zjišťována 
jednotka dvojí, na př. při trestní statistice je jednotkou trestný čin a zá- 
roveň pachatel trestného činu, v tomto případě ovšem jediným šetřením 
zjišťujeme současně dva soubory, soubor delinkventů a soubor trestných 
činů, oba sice úzce spolu souvisící, ale nikoli totožné, neboť jeden deli- 
kvent se může dopustit! více trestných činů, a naopak na jednom trest- 
ném činu může míti podíl více delinkventů. 

Z povahy statistiky a statistického šetření vyplývá, že jednotka 
Šetření má vyhovovat! těmto požadavkům: z jednotek musí býti složen 
soubor pozorovaný, jednotka musí se dáti vyjádřiti číselně a musí býti 
tak definována, aby ji bylo možno bezpečně zjistiti. 

Definice jednotky šetření vychází ovšem zase z věcné povahy x^řed- 
mětu šetření, musí přihlížeti k účelu šetřeni a pojmům, vytvořeným pří- 
slušnými vědami, ale při tom se zároveň říditi požadavky statistické me- 
thody. Na př. při sčítání lidu je jednotkou šetření ovšem individuum, ale 
třeba blíže vy mezit i, které, zda to, jež jest v kritické době na státním 
území přítomno, nebo to, které má tam stálé bydhště (podle toho zjistíme 
pak soubor obyvatelstva přítomného nebo obyvatelstva trvale bydlícího 
na státním území) ; při sčítání domů je třeba vymeziti, je-h jednotkou 
šetření dům ve smyslu jednotky administrativní nebo stavebne-technické, 
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rozřešiti otázku, kam zařadit! obývané baráky a nouzové kolonie bez 
popisných čísel, weekendové chaty a pod., avšak koná-li se šetření za 
účelejn fiskálním, je třeba položití za základ definice jednotky šetření 
definici zákona o dani domovní. 

Podobně jako jednotku šetření je třeba definovat! též znaky, t. j, 
vlastnosti jednotek, které chceme zjistiti. Podle povahy znaků, jsou-li 
kvalitativní nebo kvantitativní, přetržité nebo nepřetržité (spojité), jest 
třeba zaříditi též otázky po nich. Definice znaků se řídí opět pojmy vytvo- 
řenými j^říslusnou disciplinou, ale se zřetelem na zásady statistické me- 
thody a účel šetření. Na př. znak národnosti při sčítání lidu definuje se 
jako příslušnost kmenová, jejímž hlavním znakem je zpravidla mateřská 
řeč, ale vzhledem k účelu šetření připouštějí se výjimky, na př. pro židy, 
náboženské vyznání se definuje jako příslušnost k některé konfesi státem 
uznané, ale je třeba zařadit! i znak bez vyznání nebo příslušnosti k ně- 
které církvi sice právním řádem neuznané, ale skutečně existující, jako 
církvi metodistické a pod. 

Pro každé statistické Setření souborů jevů trvalých, tedy t. z v. sčí- 
tání, je třeba zvoliti vhodnou dobu, ve které se šetření má konati, t. zv. 
dobu kritickou. Kritická doba řídí se povahou souboru a opět účelem 
šetření; přihlíží se obyčejně k tomu, aby v ní právě byl celý soubor v khdu 
a ve stavu „normálním”; na př. sčítání lidu koná se v měsících zimních 
(u nás 15. února, posledně 1. prosince), kdy obyvatelstvo podle zkušenosti 
zdržuje se nejvíce ve svém obvyklém bydlLšti; sčítání zemědělských zá- 
vodů na jaře po skončení jarních prací zemědělských a pod. Aby bylo 
možno výsledky sčítání srovnávat! s budoucími, opakují se sčítání pokud 
možno v pravidelných obdobích, na př. pětiletých, desítOetých; mluví se 
pak o statistických šetřeních periodických. 

Při šetření souborů jevů okamžitých (událostí) koná se statistické 
šetření tím způsobem, že se stále nepřetržitě pozorují a zaznamenávají 
jednotky takového souboru; na př, sňatky, úmrtí, porody neustále se 
zaznamenávající v matrikách, přechod zboží přes celní hranice se neustále 
zaznamenává jako běžné, nepřetržité statistické šetření zahraničního 
obchodu. 

Podle uvedených směrnic se pak sestavuje dotazníkový formulář, 
obsahující otázky, potřebné ke statistickému šetření. Při sestavování 
dotazníku je třeba uvážiti nejen rozsah šetření, který je k danému účelu 
šetření potřebný, nýbrž i posouditi podrobně, jaké otázky mohou býti 
kladeny, aby bylo možno očekávat! na ně správné odpovědi, které otázky 
jsou nejúčelnějSí, jak mají býti otázky formulovány, aby byly srozumi- 
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telné, kdo má býti dotazován; dále předem rozhodnouti, co má a může 
býti zpracováno z výsledků šetření. Základní směrnice pro každé šetření 
a sestavování dotazníku jsou: dotazovat! se pouze na věci pro vyšetření 
souboru nutné, netázati se však na věci zbytečné, na takové, ii nichž 
nelze odpovědi kontrolovat! (na př. věci cistě subjektivní povahy), na 
věci takové, které pravděpodobně nebude lze zpracovávat!, na věci souk- 
romého nebo rodinného života, na takové, při nichž odpověď se zdá býti 
choulostivá nebo směšná. 

Další podrobnosti plánu se týkají organisace šetření, které statistické 
orgány mají šetření konati, doby, kdy je mají konati a způsobu, jakým 
je mají konati. 

Všechny tyto směrnice a požadavky lze však uplatuiti toliko při 
aamosiainých šetřeních statistických, která poskytují t. zv. primární sta- 
tistický materiál, to jest tam, kde pozorujeme jednotky šetření, at jde 
o jevy trvalé či okamžité, jediné za účelem statistickým, naproti tomu 
při t. zv. seJcuTidárnim statistickém materiálu je statistik vázán dodaným 
materiálem a zpracování jest omezeno na údaje získané k jiným účelům 
než statistickým, obyčejně správním. U statistického materiálu sekun- 
dárního je tedy třeba přizpůsobit i i jednotky šetření pojmům, které vzni- 
kají z norem správních. Tak na př. statistika porodů, úmrtí, sňatků za- 
kládá se na materiálu sekundárním, poněvadž se t3rto jevy populační za- 
znamenávají v matrikách za účely správními; sbírání materiálu řídí se 
tedy předpisy o vedení matrik. 

Sekundární statistický materiál může býti doplněn primárním, tím, 
že se Idadou dopHujicí otázky statistické, na př. právě při statistice pohybu 
obyvatelstva správcové matrik doplňují záznamy zřízené k účelům správ- 
ním některými otázkami povahy primárního statistického Šetření, na př. 
otázkou po národnosti snoubenců, jejich budoucím společném bydlišti atd. 

Dotazníky jsou buď individuální, pro každou sčítanou jednotku 
zvláštní, na př. při sčítání zemědělských a živnostenských závodů jest 
pro každý závod určen zvláštní dotazník, nebo hromadné, kolektivm, spo- 
lečné pro více jednotek šetření, nějakým způsobem organicky seskupe- 
ných, na př. sěítací arch pro domácnost při sčítání lidu. 

Vedle vlastních otázek obsahují dotazníky pravidelně ještě potřebné 
sankce trestní, t. j. hrozbu trestem na nezodpovědění otázek nebo ne- 
správné odpovědi, ujištění o ochraně tajemství poskytnutých údajů, 
identifikaci dotazníku běžným (pořadovým) číslem nebo jiným poznáva- 
cím znamením, dále příklady, jak odpovídat! na otázky, vysvětlivky 
k jednotlivým otázkám, poučení o účelu šetření a j. 
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IL Statisticko Šetřeni. 


Na tomto místě máme na zřeteli pouze úplné šetření souboru místně 
a časově vymezeného. Šetření samo děje se buď přímým pozorováním 
jednotek souboru, ať jsou to osoby nebo věci, nebo dotazováním osob, 
které potřebné údaje mohou poskytnout! a byly v přípravném plánu 
k tomu úkolu vybrány a určeny. 

První případ, objektivní 'pozorováni jednotek šetření, je ve statistice 
sociální řídký, na př. statistika poštovních zásilek, odesílaných v určitý 
den, nebo pouliční frekvence, zjišťovaná v některé čtvrti města, za to 
často se vyskytuje ve statistice anthropometrické, bioinetrické, při tech- 
nických šetřeních a j . 

Pravidelný případ šetření ve statistice sociální jest způsob druhý, 
vyíetrováni soxihorn dotazováním osob, které k tomu byly zvoleny. Jsou 
to podle povahy souboru a účelu šetření osoby, které mají největší zna- 
losti o něm a od kterých možno očekávat! též správnou odpověď na kla- 
dené otázky. Na př. při sčítání lidu přednostové domácnosti, při statistice 
zahraničního obchodu příjemce zboží, při dovozu odesilatel, nebo vý- 
vozce při vývozu, při sčítání zemědělských podniků vlastník nebo ná- 
jemce podniku a pod. 

Dotazy se dějí nej častěji písemně, ve formě dotazníku, který se 
těmto osobám předkládá k vyplnění, někdy ústně, kde odpovědi zapisuje 
orgán statistické služby. Oba způsoby mohou býti též kombinovány, což 
se děje hlavně za účelem kontroly spolehlivosti a úplnosti údajů. Obvykle 
se postupuje tak, že dotazníky, písemně vyplněné osobami poskytujícími 
údaje, jsou pak u nich orgány statistické služby sbírány a současně kon- 
trolovány. 

Podle subjektu, který statistické šetření podniká, lze rozeznávati 
soultromá a veřejná (úřední) statistická šetření. Sama povaha statistiky 
přináší s sebou, že úzce souvisí s veřejnou správou. Byla již učiněna 
zmínka o sekundárním statistickém materiálu, který je vlastně produk- 
tem státní a veřejné správy. Státní a veřejná správa, která má stálou 
tendenci rozšiřovati svoji působnost, přináší a zaznamenává množství 
údajů tvořících statistický materiál (na př. statistika demografická, 
trestní, veřejného pojištění, monopolů, veřejných financí atd.). Tento 
materiál poskytovaný státní správou, je též nejstarším historickým sta- 
tistickým materiálem. Naopak opět veřejná správa potřebuje ke své 
činnosti znalosti poměrů, které spravuje, a tak sama vyvolává nová sta;- 
tistická Setřeni. Vedle této souvislosti mezi veřejnou správou a stati- 
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stickými šetřeními jsou i jiné okolnosti příznivé veřejným (úředním) 
statistick3'm šetřením: donucovací moc státu, často opírající so o generelní 
klausuli zákonnou, může přinutiti občany, aby poskytovali požadované 
údaje pod sankcí trestů, což je u statistiky soukromé nemožné. Rozsáhlý 
správní aparát státu a jiných korporací veřejnoprávních může býtí po- 
staven do služeb statistického šetření, což při velkém rozsahu četných 
statistických šetřeni je podmínkou pro jejich zdar. Stát může si opatřiti 
lépe též potřebné odborné síly i finanční prostředky, neboť statistická 
šetření velkého rozsahu jsou samozřejmě i velmi nákladná. Všechny tyto 
okohiosti, nehledíme-li ani ke skutečnosti, že stát zasahuje v poslední 
době stále pronikavěji do sociálních poměrů, vedou k tomu, že státní 
příp. veřejná statistika zatlačuje čím dále tím více statistiku soukromou, 
která, se nyní omezuje na šetřeni k účelům vědeckým, na př. lékařským, 
anthropometrickým, biometrickým, dále technickým, pojišťovacím a j. 
Konání statistických šetření je nyní vázáno na schválení Státním úřadem 
statistickým podle vlád. nařízeni č. 186/194:0 Sb. 

Ovšem též veřejná statistická šetření mají některé nevýhody. Je to 
častá nedůvěra ke státním orgánům, obava před zdaněním nebo jinými 
nepříznivými důsledky poskytnutých údajů (statistických údajů získa- 
ných protek torátní statistikou bylo přímo užíváno k předpisu povinných 
dodávek, na př. ovoce!). Též administrativní rozdělení státního území 
neodpovídá vždy skutečným poměrům zeměpisným, demografickým, 
hospodářským a j., které jsou vyšetřovány, a finanční situace státu ome- 
zuje často rozsah setření. 

V Československu byla přijata jako ve většině států moderní zásada 
soustředění statistických šetření, ať svou povahou spadá materiál sta- 
tistický do kteréhokoli oboru státní správy. Veškerá statistická setření 
dcjí se až na malé výjimlcy zásadně u Státního úřadu statistického, 
zvláště k tomu účelu zřízeného. 

Organisace statistické služby státní se zakládá na zvláštním zákoně 
ze dne 28. ledna 1919 č. 49 Sb. Na Slovensku byl zřízen Státny plánovací 
a štatistický úřad nařízením Slovenské národní rady za dne 26. května 
1945 č. 48 sb. S. N. R. Jednota statistické služby u obou těchto úřadů 
byla upravena dohodou vlády a Slovenské národní rady z dubna 1946. 

Vedle státního úřadu statistického provádějí statistická setření po- 
vahy veřejné ještě městské statistické kanceláře hlav. města Prahy a 
některých větších měst. Jejich pravomoc není až dosud upravena zvlášt- 
ním zákonem. Úřady ty konají některá šetření místní povahy, zpracují 
a uveřejňují samostatně jejich výsledky, stejně jako výsledky státních 
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šetření pro příslušnou obec, jinak spolupracují se Státním úřadem sta- 
tistickým. 

Jako podřízené výkonné orgány fungují při některých statistických 
Setřeních různé orgány správy vnitřní, finanční i soudní, podle povahy 
šetření, na př. politické úřady a obecní úřady při sčítání lidu, celní úřady 
při statistice zahraničního obchodu, soudní kanceláře při statistice soudní 
atd. Pro velká sčítání se zjednávají vedle toho i statistické orgány mimo- 
řádné, jako sčítací komisaři při sčítání lidu. 

III. Zpracování a uveřejnění statistických dat. 

Statistický materiál, který vznikl jako výsledek šetření, musí býti 
před konečným zpracováním kontrolován, je-li úplný a správný. To se 
děje buď u podřízených orgánů, které šetření konají, nebo u úřadu, který 
má provésti konečné zpracování, jestli sám setření koná. Hlavní účel této 
kontroly jest zabrániti tomu, aby nebyly části pozorovaného souboru 
vynechány, na př. domy při sčítání lidu. 

Statistický materiál v původním stavu, t. j. individuelní údaje, 
zpracují se zásadně nejprve sčítáním, a to podle skuphi, t. j. jednotky 
se současně třídí podle různých znaků, místních, časových, věcných. 

Při šetřeních většího rozsahu, t. j. kde se zjišťuje větší počet znaků, 
používá se k dalšímu zpracování t. zv. sČitacicJi lístků neboli Mtků, t. j. 
přesně stejných kartonů, na které se přenášejí zjištěné znaky. Každý 
šetřený případ obdrží jeden štítek (na př. při sčítání lidu každý obyva- 
tel = jednotka šetření = štítek), na který se zaznamenává, který znak, 
v které obměně nebo velikosti, se ii něho vyskytl. Toto zaznamenávání 
se děje obyčejně postupem zvaným dírkování, t. j. na pořízené sestavě 
číshc se vyznačí podle umluveného klíče proražením na určitém místě 
znak a jeho stupně (nebo obměny); obyčejně děje se tak mechanicky t. 
zv. dírkovacím strojem. Kde je to možno, lze použiti též již dotazníko- 
vého formuláře, vyhotoveného v podobě štítku, což znamená, že se uspoří 
přenášení znaků ze sěítacího archu na zvláštní štítek. 

Sčítání samo se může díti různým způsobem : 

1. čárkováním, opakujícím se tolikráte, kolilcrát se který znak vy- 
skytuje (na př. pohlaví mužské), každý ze sčítaných případů, kde se vy- 
skytuje, vyznačí se čárkou, které pak za účelem lehčího sčítání a kontroly se 
seskupují v různé obrazce, obsahující určitý počet jednotek, na př. po pěti: 

IX a pod.; 
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Příklad č. 4< 


Vzor Hitku ^perforovaného, používaného při statistice zahraničního obchodu 
(perforovaná místa jsou tmavě vyznačena). 
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2. lepením známek z útržkového bloku. Pro každý znak jest určena 
zvláštní známka, pro každý případ se nalepí známka a běžným číslem. 
Přitom jest možno i sčítati zároveň různé kombinace znaků, na př. kom- 
binaci pohlaví mužského, národnosti německé, náboženství římsko-kato- 
lického, pro každou kombinaci musí býti určena známka určité odlišné 
barvy; 

3. sldádáním sčítacích lístků (štítků). V tomto případě musí již znaky 
býti vyznačeny nebo převedeny na štítky. Štítky se pokládají podle stej- 
ného znaku na sebe a složené hromádky se pak sčítají. 

Daleko Častěji, a to zvláště při všech větších statistických šetřeních, 
používá se však mechanického zpracování štítků zvláštními, k tomu účelu 
konstruovanými stroji statistickými. Jak již bylo uvedeno, znaky se pře- 
vádějí podle zvláštního klíče na systém číselný, kde se pak vyznačují po- 
mocí dírkovacích strojů na štítcích dírkami (perforacemi). Štítky tímto 
způsobem dírkované se pak automaticky třídí a skupiny sčítají třídícími 
stroji, zakládajícími se v podstatě na tom, že elektrický proud prochází 
volně dírkami, jest však přerušován kartony štítků na těch místech, kde 
nejsou dírkovány. Skupiny perforovaných štítků, vzniklé tříděním, se pak 
sčítají stroji tabulačními. Stroje tyto (vynalezené Holerithem, nyní nej- 
více používány jsou velmi zdokonalené stroje Powersovy) jsou poháněny 
elektricky a umožňují velmi rychlé zpracování velilíého množství sta- 
tistických údajů, jsou tedy velmi vhodné zejména pro velká statistická 
šetření a vůbec pro systém centrálního zpracování statistických dat. 
Zpracování takové při rozsáhlé dělbě práce má ráz tovární velkovýroby. 

Zpracování statistického materiálu nazývá se též francouzským 
názvem dépouillement. 

Výsledky sčítání se vyznačují do pomocných tabulek pracovních, 
ze kterých se pak sestavují tabulky konečné. 

Po stránce organisační děje se zpracování samo buď podle zásady 
centralisační, takže veškerý statistický materiál se dodává jedinému cen- 
trálnímu úřadu, kde se pak jednotně zpracuje (jako je tomu u nás), nebo 
decentralisaČní, kde se materiál zpracovává hned u orgánů statistických 
na místě šetření a pouze konečné zpracování se děje v úřadě centrálním. 
Výhody centralisační zásady, jednotný způsob zpracování, dělba práce, 
možnost opatřiti strojní nákladná zařízení a odborné síly, způsobují, že 
tato zásada v moderní statistické službě převládá; naproti tomu podrobná 
kontrola údajů působí při systému centralisačním někdy obtíže. 

Zpracované výsledky statistických šetření sestavují se v tabulky, 
které pak slouží jako pramen dalšího hodnocení a vědeckého zpracováni. 
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Tabulky jsou číselné přehledy výsledků statistických šetření, k nim 
se pak přidává text, především hlavička a legenda, které uvádějí pojmy, 
jež Čísla dále vyjadřují. Dále se připojují poznámky o šetření, zejména 
vysvětlení, co je jednotkou souboru, jednotkou šetření, definice znaků 
atd.; k tomu přistupuje ještě obyčejně popis šetření, výklad o použitých 
dotazníkových formulářích a pod. Konečně se obvykle připojuje výklad 
o výsledku šetření, ve formě všeobecné nebo podrobnější, případně mající 
již povahu vědeckého rozboru vyšetřeného materiálu. 

Tabulky se rozdělují systémem kolmých a vodorovných přímek na 
sloupce a řádky, a umožňují výsledky uveřejňovat! podle zjištěných zna- 
ků místních (na př. údaje pro jednotlivé obce, soudní okresy, politické 
okresy, země atd.), časových (na př. pro měsíce, roky), věcných (na př. 
druhy povolání obyvatelstva). Se zřetelem k nutné přehlednosti tabulek 
nedoporučuje se vyznačit! na jedné tabulce více než Čtyřnásobnou kom- 
binaci znaků. Kombinací rozumíme rozdělení souboru současně podle 
dvou nebo více znaků, na př. obyvatelstva podle národnosti a povoláni, 
nebo skládání jednotek podle různých znaků (věcných, místních, časo- 
vých). Seskupováním jednotek podle kombinací znaků postupujeme pak 
při zkoumání závislosti mezi znaky. 

Vedle čísel absolutních zařazují se v tabulky též čísla poměrná. 

Výsledky statistických šetření uveřejňují statistické úřady v publi- 
kacích zvaných pramenná díla^ která obsahují podrobné údaje šetřením 
získané, a6 jde o sčítání nebo stálá statistická zaznamenávání za určitá 
období; vedle toho obsahují též tabulky s kombinacemi v různém rozsahu, 
grafická znázornění výsledků a příslušný text. 

Literatura ke kapitole 6. D. KrejČi Základy statistiky, 2. vyd. 
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Kapitola 6. 


STATISTICKÉ ZNAKY A ROZLOŽENÍ 
STATISTICKÝCH SOUBORŮ. 


I. Statistické znaky. 

Účelem statistického pozorování je popisovati a analyso váti soubory 
hromadných jevů. K tomu je třeba znáti nejen rozsah souborů, nýbrž též 
znaky souborů, t. j. některé vlastnosti, které jevy blíže určují a rozlisují. 
Tyto znaky, které chceme vyšetřiti, dělí se podle své povahy na dvě 
hlavní skupiny: 

1. znaky kvalitativni, 

2. znaky kvantitativní. 

Znaky kvalitativními nazýváme ony znaky, které vyjadřují nějakou 
vlastnost, jež se nedá měřiti, a při nichž při statistickém pozorování 
pouze zjišťujeme, zda se znak u pozorované jednotky vyskytuje čili nic. 
Na př. mužské pohlaví, náboženské vyznání římsko -katolické, povolání 
zemědělec při sčítání lidu; u každého vyšetřovaného obyvatele (jednotky) 
zjišťujeme, zda se tento znak u něho vyskytuje čili nic. Také znaky kvali- 
tativní jsou měnlivé potud, že se vyskytují obměny znaku, buď dvě, na 
př. pohlaví mužské a ženské, t. zv. alternativní obměny znaku kvalitativ- 
ního, nebo více obměn, t. zv. množné obměny nebo množné třídění znaku 
kvalitativního, na př. národnost česká, německá, polská, maďarská, 
ruská a jiná. 

Znaky kvantitativní jsou ty znaky, které jsou obsaženy u každé 
jednotky souboru, ale které se od jednotky k jednotce mění a které se dají 
vyjádřiti různými hodnotami (kvantitativně) podle nějakého obvyklého 
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měřítka. Jsou to znaky, které se dají buď měřiti nebo sčítati. Na př. věk, 
který se vyskytuje u každého pozorovaného obyvatele (jednotky soubo- 
ru), ale vždy v jiné hodnotě, a který se vyjadřuje pomocí obvyklých mě- 
řítek časových (rok, měsíc, den), je znak měřitelný, počet zaměstnanců 
v závodě živnostenském je znak sčítatelný. 

Podle toho, kterého diuhu jsou vyšetřené znaky, postupuje se při dal- 
ším popisu a rozboru odlišným způsobem. 


II. Rozložení statistických souborů. 

Ze zákona velkých čísel vyplývá, že statisticlíá šetření musí býti roz- 
sáhlá, čímž docházíme k velkému počtu iidajů, který je podmínkou spo- 
lehlivosti daného statistického materiálu a všech dedukcí, které z něho 
chceme získati. Abychom učinili tento rozsáhlý statistický materiál pře- 
hledným a mohli jej dále zpracovati, je jej třeba upraviti v nějaký systém. 
To se děje tím, že seřazujeme soustavně statistické údaje podle nějakého 
hlediska, buď podle velikosti znaku od nej menší hodnoty postupně až 
k největší nebo naopak, jde-li o soubor obsahující znak kvantitativní, 
nebo podle jiného hlediska, na př. místního, obsahuj e-li soubor znak kva- 
litativní. Takto uspořádané statistické údaje se nazývají též statistickými 
řadami a sestavují se obyčejně ve formě statistických tabulek. 

Věcné rozložení statistického souboru, obsahujícího znak kvantita- 
tivní, sestavuje se tak, že jednotlivé hodnoty znaku kvantitativního 
v souboru se vyskytující se seskupují ve skupiny zvané třídy a zjišťuje se 
četnost (frekvence) těchto skupin. Statistická tabulka má pak dva sloup- 
ce: v prvním jsou seřazeny podle velikosti různé hodnoty kvantitativnílio 
znaku, které byly pozorovány, obyčejně sdružené do tříd, v di’uhém 
sloupci je uveden počet jednotek, u nichž byla každá z těchto hodnot 
(hodnot třídy) při šetření zjištěna. 

Je-li znak kvantitativní vyjádřen v celých jednotkách a ne vy kazu je -li 
příliš mnoho hodnot, dostáváme jednoduchý případ, kde třídy jsou dány 
přímo jednotkami znaku (tak zv. znak sčítatebiý, měnící se přetržitě). 
V takovém případě, kde kvantitativní znak je dán přímo v celých jed- 
notkách a rozpětí znaku (t. j. rozdíl mezi nejmenší a největší hodnotou 
znaku v souboru se vyskytující, t. zv. variační rozpětí) je malé, je též 
sám sebou dán interval třídy, t. j. rozdíl mezi třídami. 

Častější případ však bývá ten, že kvantitativní znak se mění nepře- 
tržitě (spojitě), t. j. nabývá hodnot velmi Četných podle přesnosti šetření 
(je to znak měřitelný). V takovém případě je nejprve třeba zvoliti vhodný 
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třídní interval. Intervaly volíme zásadně stejné, aby bylo možno srovnávat! 
mezi sebou četnosti tříd a postupovat! k dalším statistickým operacím. 

Poznámka. Vo výjimefiných případech, kdo to vyžadují zvláštní důvody, 
zásada rovnosti intervalů se nezachovává, pak ovšem nelze srovnávati četnosti 
tříd mezi sebou. 

Kvantitativní znak měřitelný vyjadřujeme v obvyklých jednotkách 
míry, váhy, ceny a pod. a podle nich tvoříme též třídy. Na př. ceny tří- 
díme tak, aby intervaly třídní byly 10 nebo 20 nebo 100 Kčs, pozorování 
anthropometrická tak, aby intervaly byly 2 nebo o nebo 10 centimetrů 
podle rozsahu souboru, věk obyvatelstva podle jednoho nebo 5 roků a pod. 

Při sestavování tabulek rozložení četností postupujeme tak, že nej- 
prve zvolíme interval třídy, stanovíme jeho velikost, dále určíme bod 
(hodnotu), od kterého vycházíme. Jako třídní interval bere se jednotka 
v případě, jestliže změny v ní vyjádřené jsou dosti značné. Jestliže však 
změny v kvantitativním znaku postupují příliš pomalu, je třeba zvoliti 
hodnotu jinou (na př. v uvedeném případě 5 let). V tomto případě se vy- 
žaduje, aby hodnoty, spadající do každé třídy, příliš se neodchylovaly 
od středních hodnot tříd (ua př. aritmetického průměru), dále aby interval 
byl dosti veliký, abychom se vyvarovali příliš velkého počtu tříd. 

Tomuto požadavku vyhovuje obyčejně pravidlo, že rozdělíme rozdíl 
mezi nejvyšší a nej nižší hodnotou patnácti až dvacítipěti a tak dostane- 
me 15 až 25 tříd, které obyčejně postačí k popisu pozorovaného jevu, aniž 
se tabulka rozložení četností stala při tom nepřehlednou. 

Pokud jde o stanovení bodu, od kterého při klasifikaci vycházíme, 
lze zvoliti číslo libovolné, obyčejně se vsak volí číslo celé. Důležitosti na- 
bývá tato volba na př. tehdy, máme-li pochybnosti o správnosti stati- 
stického materiálu, abychom nekladli hranice tříd právě na hodnoty, 
které považujeme za nesprávné (na př. věk 40, 50, BO let, ježto právě 
údaje o věku bývají podle zkušenosti nesprávně zaokrouhlovány na roky, 
končící desítkou). 

Důležité jest, aby hranič né hodnoty mezi intervaly byly stanoveny 
přesně, t. j. tak, aby nevznikly pochybnosti, do které třídy má býti který 
pozorovaný případ zařaděn. Aby bylo jasně vyznačeno, kde jest hraniční 
hodnota, označují se intervaly někdy způsobem: 

0 — 

10 — 

20 — 

30 — atd., což znamená, že veškeré hodnoty nižší než 10 zařazují se 
do třídy první, hodnoty počínající 1 0 a nižší než 20 do třídy druhé, hod- 
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noty počínající 20 a nižší než 30 do třídy třetí atd. Jindy se označují třídy 
konečnou hodnotou; — 10 
—20 

— 30 atd., což znamená, že veškeré hodnoty včetně 
10 spadají do třídy první, veškeré hodnoty včetně 20 spadají do třídy druhé 
atd. Nebo se označují třídy střední hodnotou (průměrem intervalu) každé 
třídy, tedy ve stejném případě; 5 

15 

25 


35 atd. 

Počet zjištěných jednotek, vykazujících hodnoty v hranicích inter- 
valu, dává nám četnost této třídy. 


Příklad č. 6. Vlkové rozvrstveni mužů v Čechách podle pětiletých skupin 

věkových r. 1921. 

Ve věku 

Ve věku označe- 

Dokončený rok věku 

označeném bylo 
přítomno 

ném bylo z 1000 
přítomných 

0- 4 

217.492 

67,8 

5- 9 

315.461 

98,4 

10-14 

368.495 

114,9 

15-19 

354.167 

110,4 

20-24 

304.307 

94,9 

25-29 

246.483 

76,8 

30-34 

219.020 

68,3 

35-39 

206.940 

64,5 

40-44 

196.464 

61,3 

45-49 

182.504 

56,9 

50-54 

160.548 

50,1 

55-59 

136.147 

42,4 

60-64 

114.885 

35,8 

65-69 

83.083 

25,9 

70-74 

54.324 

16,9 

75-79 

29.880 

9,3 

80-84 

12.097 

3,8 

85-89 

2.912 

0,9 

90-94 

621 

0,2 

95-99 

96- 

0,0 

100 a více 

— 

— 

(neznámý) 

(1.710) 

3,207.636 

(0,5) 

1000 
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Přiklad c. 6. Příklad nerovných intervalů: 

Obyiratelstvo v Cechách v r. 1930 podle velikosti obce pobytu. 


Velikostní skupina 
obcí podle počtu 
obyvatelů 

Obce 

Přítomné 

obyvatelstvo 

absolutně 

ze 100 
obyvatelů 

100 

168 

14.198 

0,2 

101- 200 

1.510 

236.236 

3,3 

201- 300 

1.745 

432.288 

6,1 

301- 500 

2,123 

825.244 

11,6 

501- 1.000 

1.721 

1,189.525 

16,7 

1.001- 2.000 

709 

963.651 

13,6 

2.001- 5.000 

336 

1,031.400 

14,5 

5.001- 10.000 

79 

554.685 

7,8 

10.001- 20.000 

35 

472.972 

6,7 

20.001- 50.000 

14 

425.650 

6,0 

50.001-100.000 

— 

— 

— 

100.001 a více . . . 

2 

963.527 

13,5 

lihrn . . . 

8.442 

7,109.376 

100,0 


Kdyby byly v tomto případě voleny intervaly stejné, vzniklo by bud 
příliš mnoho tříd, nebo by musily býti zvoleny intervaly příliš veliké, na 
př. o 2000 obyvatelích, a pak by veliká většina všech případů připadla 
do třídy první a tím by se úplně zatemnilo rozložení obyvatelstva podle 
obcí. 

Někdy se porušuje zásada stejných intervalů též proto, že se z původ- 
ních tříd znaků vytvářejí samostatné útvary, ze kterých se stávají nové 
pojmy, na př. města s více než 100.000 obyvateli se nazývají velkoměsta, 
obce s méně než 2000 obyvateli se považují za obce venkovské, nebo ze- 
mědělské závody ve výměře do jednoho hektaru se označují jako závody 
trpasličí, zemědělské závody od 20 do 50 ha jako střední statky a pod., 
a tvoří pak samostatné pojmy kategorie sociologické, demografické nebo 
ekonomické. 

Rozborem tabulek četností znaku kvantitativního můžeme sledovati 
pravidelnosti v rozložení četností. Zejména názorné je grafické vyjádření 
rozložení četností pomocí dvou os kolmých, z nichž na osu horizontální 
nanášíme stupně znaku kvantitativního (intervaly tříd), na kolmice 
vztyčené v bodech těchto intervalů pak nanášejí se příslušné četnosti. 
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křivka, kterou se spojují body takto získané, nazývá se frekvenční křiv- 
kou. Jindy znázorňuje se rozložení četností polygonem četností čili histo- 
gramem, kde body na kolmicích vztyčených ve středu intervalů nespojují 
se křivkou, nýbrž krátkými vodorovnými přímkami (srv. kap. 13,). 

Základním typem rozložení četností, zvaným též rozložem' normální, 
je typ symetrického rozložení, u kterého Četnosti postupně stoupají od 
nejnižších hodnot znaku ke středním hodnotám, kde četnost dostupuje 
vrcholu, a potom zase klesají s rostoucími hodnotami znaku. Eozložení toto 
se blíží theoretickému rozložení odchylek, jaké nám představuje Gaussova 
křivka. S úplnou symetrií nesetkáváme se však v souborech sociálních 
jevů snad nikdy, nýbrž pravidlem bývá typ více nebo méně asymetrický. 
Symetrickému rozložení vzdáleně se blíží rozložení četností soudních 
okresů v Čechách podle úmrtnosti v příkladu č. 7. 


Příklad č. 7. Roziřídéni soudních oheaii v Čechách podle úmrtnosti 
r. 1927 {Boháč, Studie o populaci, Praha 1928). 


Počet zemřelých 
na 1000 obyvatel 

méně než 1 1 

11-12 

12- 13 

13- 14 

14- 15 

15- 16 

16- 17 

17- 18 

18- 19 

19- 20 

20 - 21 

21-22 

22-23 


Počet okresů 
s příslušnou úmrtností 

1 

10 

18 

42 

43 
43 
32 
15 

8 

3 

4 
2 
1 


V grafickém znázornění: 

Počet okresů Úmrtnost 
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v souborech jevů sociálních se však častěji vyskytují případy, že 
četnosti jsou rozloženy nesouměrně tak, že při grafickém znázornění je 
vrchol křivky posunut na jednu nebo druhou stranu křivky, modus se 
při tom odchyluje od aritmetického průměru a mediánu (srv. kap. 7.), 
Jindy se vyskytují i frekvenční křivky nesouměrné o dvou nebo více 
vrcholech. Tento případ se vyskytuje obyčejně u jevů, které nejsou stej- 
norodé, nýbrž se skládají z více souborů. 

Konečně se vyskytují frekvenční křivky zcela nesouměrné, na př. 
takové, kde maximum četností (vrchol křivky) je položeno na jednom 
kraji křivky. Je to případ firekvenční křivky v podobě obráceného velkého 
J, která se vyskytuje často u souborů hospodářských (na př. rozložení 
četností daně důchodové podle výše zdaněných důchodů, rozložení země- 
dělských podniků podle velikosti výměry podniku a pod.). Největší čet- 
nost se vyskytuje v těchto případech mezi nej menším i hodnotami souboru. 

Přiklad č. 8. Roztřidéni okresů v Čechách podle výše natality r. 1927 
(Boháč 1. c. str. 22). 


Počet okresů 



11 13 15 n 19 21 23 25 27 29 31 
Živ6 narozených do 1.000 obrv. 


(příklad rozložení četností, jehož vrchol je posunut k jedné straně 
polygonu). 


Příklad č. 9. Roztřidšni oib-esů v Československri podle i>ýŠe natality 
r. 1926 (Boháči, c. str. 22). 


Počet okresů 



natalita 


II 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 
2lv6 narozených nn 1.000 obyv. 
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(příklad nesouměrného rozložení se dvěma vrcholy, které ukazují na to, 
že obyvatelstvo celého státu netvořilo po stránce demografické soubor 
zcela stejnorodý, zvláště se tu projevoval nepochybně vliv Zakarpatské 
Ukrajiny s odlišnými podmínkami demografickými). 

Přiklad č, 10. Rozloženi četnosti vyjádřené frekvenční křivkou. 
Četnosti 
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Rozložení četností poplatníků daně z příjmu ve Spojených státech 
r, 1918. Obsahuje všechny poplatníky, jejichž příjem byl nižší než 4000 
dolarů. Interval třídy činí 500 dolarů. [C, Mills, Statistical methods 
applied to economics and business, New-York 1924, str. 86). 

Statistický soubor se znakem kvantitativním může býti upraven též 
takovým způsobem, že se četnosti jednotlivých tříd stále k sobě přičítají 
Čili kumulují se. V grafickém znázornění obdržíme pak zvláštní křivku 
četností, t. zv. křivku kumulační, která má podobu asi velkého S (Mills 
nazývá ji křivkou ogivní). 

Přiklad č. 11. Křivka kurmilačni. Rozložení četností souboru pil ve 
Spojených státech amerických r. 1920 podle výše pracovních nákladů 
(za 1000 stop zpracovaného dříví), dole polygon četností, nahoře kumu- 
lační křivka Mills 1. c. str, 94), 

Poznámka. Pro frekvenční křivky, které se blíží svým tvarem některému 
z fcypiclcých tvarů frekvenčních křivek, lze nalézti analytické rovnice pomocí 
kterých je možno rozložení četností v daném souboru přesněji stanovití. Známá 
je na př. z historie národního hospodářství formule Paretova, která obsahuje ana- 
lytickou rovnici pro rozložení četností typu J, charakteristické pro soubory hospo- 
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dářské. Tuto rovnici odvodil Pareto ze souboru důchodů a zní (je to křivka expo- 
nenciální): 

y Aaí“0 nebo ve formě log y = log A — a log x 

{Pareto^ La courbe dea revenus, Coura ďEconomie politique 2, Lausanno 1897,) 
Některé z těchto analytických rovnic mají význam též při sestrojování úmrtních 
tabulek. 

Příklad ě. 11. 



■doo 2oo 3oo ^oo 5oo Goo 7co <Soo 

doVarA- 

Statistický soubor lze někdy iipraviti též s hledisica místního. V3rtvorí 
se t. zv. rady místní^ ve kterých statistické hodnoty jsou uspořádány 
podle místních obvodů, na které se vztahují. Místní obvody jsou obyčejně 
dány již samýin administrativním rozdělením území, na kterém se sta- 
tistické šetřeni konalo: územím obcí, okresů soudních, politických, zemí 
a jiných obvodů správních. Z těchto základních jednotek se někdy se- 
stavují za účely lepšího přehledu vyšší jednotky mLstní, podle povahy 
souboru, na př. zmíněné přirozené oblasti pro soubory rázu zemědělského. 
V uspořádání řad místních rozhoduje do značné míry subjektivní hle- 
disko statistikovo, uspořádá-li řadu podle nějakého směru geografického, 
ěi podle politického nebo hospodářského významu místních obvodů či 
jmého hlediska, nebo jen podle abecedního sledu jmen obcí, okresiů, států. 


4 Rukovčť statistiky 
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v uspořádání takových mistních řad mňže se tedy dó značné míry uplat- 
niti libovůle. 

Obsahuje -li soubor znak lívaliiatívniy lze uspořádat! jej podle obměn 
znaku kvalitativního. Obměny samy jsou ovšem uspořádány opět podle 
hlediska statistikova, buď podle významu jednotlivých obměn, nebo podle 
zvláštního klasifikačního schématu, je-li počet obměn velmi velký, jako 
je tomu na př. u povolání obyvatelstva zjišťovaného při sčítání lidu, 
u druhů zboží zjišťovaných při statistice zahraničního obchodu. Každá 
hodnota řady vyjadřuje počet případů (četnost) obměny znaku, který se 
v souboru vyskytl (na př. počet Čechů, Němců a ostatních národností při 
sčítání lidu v souboru obyvatelstva). 

Jsou-li soubory upraveny v časovém sledu statistických údajů podle 
obvyklých jednotek časových, dní, týdnů, měsíců, roků, mluvíme o řa- 
dÁcli ča,sovčfch, o nichž budě podrobnější výklad v kapitole 
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Kapitola 7. 


’ STATISTICKÉ CHARAKTERISTIKY. 


Jako statistické charakteristiky označujeme hodnoty, které vyjadřují 
a charakterisují soubor. Vypočítáváme je, abychom zjednodušili soubor 
složený z mnoha statistických údajů (hodnot) a zároveň jej charakteriso- 
vali vhodnou hodnotou, která nivelisuje odchylky v souboru se vyskytující. 

I. Charakteristiky polohy. 

\ , Aritmetický průměr. Nej jednodušší a nej častěji používanou sta- 
tistickou charakteristilíou je aritmetický průměr. Aritmetický průměr 
obdržíme, dělíme-li součet všech hodnot souboru počtem hodnot, tedy 
označíme-li jednotlivé hodnoty statistického souboru písmeny íK;, ajg, 

X 4 až Xry je vzorec aritmetického průměru 

A = -í— ! — ^ ^ * nebo v podobě A = — 

r r 

kde písmenem A označujeme součet těch hodnot, které jsou za ním uve- 
deny v závorce. (Místo 'písmene A užívá se pro aritmetický pyrimh hodnot 

Zj atd. tiz ozw^ení Z.) 

Nej důležitější vlastnosti aritmetického průměru jsou tyto: úhrn veške- 
rých odchylek (positivních i negativních) jednotlivých hodnot souboru od 
aritmetického průměru se rovná nule; součet dvojmocí těchto odchylek je 
menší než součet dvojmocí odchylek jednotlivých hodnot souboru, vypo- 
čtených od jakékoli jiné hodnoty souboru (čili je minimum). Říkáme též, 
že aritmetický průměr je z celého souboru hodnota nej pravděpodobnější. 

Obsahuje-li soubor znak kvantitativní, je třeba jednotlivé hodnoty 
znaku násobiti příslušnou jejich četností, jmenovatelem je pak ovšem sou- 
čet všech četností znaku v souboru. Takový aritmetický průměr můžeme 
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vyjádřiti vzorcem A = 


2:(M 


, kde / znamená četnost každé hodnoty x. 


Aritmetický průměr, při kterém bereme zřetel k četnostem hodnot, 
nnzývá se průměr vážený (z anglického weighted average), poněvadž 
v něm dáváme jednotlivým hodnotám tu váhu (význam), jakou četností 
jsou zastoupeny v celém souboru. Volný výběr vážiti či nevážili průměry 
máme zvláště ve statistice cenové. 

U znaků kvantitativních, měnících se spojitě (nepřetržitě), často 
i u znaků měnících se přetržitě, avšak u nichž je rozpětí hodnot veliké, 
naráží vypočítávání aritmetického průměru na obtíže. Uvnitř každého in- 
tervalu jest totiž řada hodnot, jejichž velikost ani četnosti neznáme. V ta- 
kových případech pomáháme si často tím, že předpokládáme, že hodnoty 
uvnitř intervalu rostou pravidelně, a že tudíž aritmetický průměr hodnot 
znaku a jejich četností se rovná aritmetickému průměru horní a dolní 
hranice intervalu (tento předpoklad nemusí se ovšem shodovat! se skuteč- 
ností, čímž vzniká jistá nepřesnost takto vypočtené hodnoty). 

Za základ výpočtu aritmetického průměru v tomto případě bereme 
střed intervalu, který násobíme četností každé třídy. Součet těchto sou- 
činů pak dělíme počtem všech případů (četností). 

Příklad c. 12. Počet vdaných žen v Čechách podle skupin vČku r. 1930. 

(Částečný soubor.) 

Vek v dokončených letech Počet vdaných žen 


1 9 a méně 

8.629 

20 až 24- 

118.390 

25 až 29 

221,586 

30 až 34 

240.283 

35 až 39 

211.308 

40 až 44 

179.473 

45 až 49 

158.358 


Úhrn 1,138.027 

Středy intervalů každé skupiny násobíme četností skupiny (třídy): 


k^alu skupiny 

četnost skupiny 

17 

8.629 

22 

118.390 

27 

221.586 

32 

240.283 

37 

211.308 

42 

179.473 

47 

158.358 


úhrn 1,138.027 


52 


Aritmetický průměr se rovná 


A = 


17 X 8.629 + 22 X 118.390 + 27 x 221.686 + 32 x 240.283 -f 37 x 
1,138.027 

X 211.308 + 42 X 179.473 + 47 X 158.358 


1,138.027 


= 34,466 let. 


Výpočet aritmetického průměru můžeme si z jednoduší ti pomocí 
prozatímního aritmetického průměru, t, j. vhodně zvoleného počátku, 
čímž se vyhneme obtížnému sčítání a dělení velkými čísly. K tomu slouží 
vzorec, zakládající se na uvedené vlastnosti aritmetického průměru, že 
úhrn odchylek od něho se rovná nule: 

^ _ (x, — + {x^ — A^) + {x^ — ^o) + ■ - {Xr — ^o) ^ ^ 

r ' 

t. j. libovolnou liodnotu souboru bez výpočtu zvolíme za prozatímní 
průměr a označíme ale tak, aby přibližně, podle odhadu, nebyla příliš 
vzdálena od skutečného aritmetického průměru. Tuto hodnotu odečteme 
od každého Člena statistické řady a pak ji k celkovému průměru těchto 
rozdílů opět přičteme. Výhoda tohoto postupu je patrná, že se značné 
zmenšují čísla, se kterými počítáme a celý počet se ulehčuje. 

Podobným způsobem lze postupovat! též tehdy, je-li soubor rozdělen 
ve třídy podle znaku kvantitativního. Rozdíly od prozatímního průměru 
počítáme pak v jednotkách třídy a výsledek násobíme intervalem třídy. 

Ve výše uvedeném příkladě bychom postupovali tímto způsobem: 


Střed intervalu 

Rozdíl od prozatímního 

Četnost 

Součin 

třídy 

průměru 

třídy f 

a f 

17 

-3 

8.629 

- 25.887 

22 

-2 

118.390 

-236.780 

27 

~1 

221.586 

-221.586 

32 

0 

240.283 

-484.253 




úhrn záporných 

37 

+1 

221,308 

+ 211.308 

42 

+2 

179.473 

+ 358.946 

47 

+3 

158.358 

+ 475,074 

+ 1,045,328 
úhrn kladných 


- 484.253 
+ 1,045.328 


úhrn + 661.075 


53 


Za prozatímní průměr zvolíme v tomto případě střed třídy A = 
od tohoto průměrů počítáme rozdíly tříd (sloupec druhý). Rozdíly pak 
násobíme četnostmi (sloupec čtvrtý). Součiny sečteme, záporné i kladné 
zvláště, konečný součet dělíme pak součtem všech četností: 

561.075 : 1,138.027 = 0,493 jednotek třídních. 

Výsledek násobíme třídním intervalem / = o 
0,493 X 5 = 2,465 

a přičteme nyní ke zvolenému prozatímnímu průměru A „ 

^ = 32 + 2,465 = 34,465 

(malý rozdíl ve třetím desetinném místě je způsoben nepřesností krácení 
při dělení). 

Aritmetický průměr celkového souboru, skládajícího se ze souborů 
dílčích, rovná se součtu aritmetických průměrů těchto dílčích souborů: 
A = A^ A^. 

Aritmetický průměr jako veličina vypočtená je hodnota abstraktní, 
to znamená, že se ve skutečnosti nemusí taková hodnota v celém souboru 
vyskytnouti; čímž trpí aritmetický průměr tím více, čím je rozložení 
souboru nesouměrnější. 

Jiné statistické charakteristilty abstraktní, jichž se ve statistice Čas 
těji používá, jsou zvláště geometrický průměr, dále harmonický a kvadra- 
tický průměr. 

2. Průměr geometrický roven je součinu všech členů souboru, od- 
mocněnému odmocnitelem, který se rovná počtu těchto členů podle vzorce 

r 

G ^ Xi- X Xz X .Tg X ^4 X . .Xr. 

Geometrický průměr má hlavně ty vlastnosti statisticky významné, 
že není tak citlivý k extrémním hodnotám a že je nižší než průměr aritme- 
tický z téhož souboru. Používá se ho zvláště ve statistice cenové a k se- 
strojování indexů. 

Obsahuje-h soubor znak kvantitativní a je-li rozdělen na třidy, vy 
počítává se geometrický průměr podle vzorce 

r 

G = 1' Xi X X ÍC3* X . .u/r 

ťozuániku. Zřídka s© používá průměru harmonického, ktorý jo vla^ítně zvrat - 
íioii (reciproční) hodnotou průměru aritmetického podle vzorce 





a průměru kvadrafcického, rovněž v podstatě piíůměru aritmetického,, jolutó jed- 
notliví členové se umocňují dvěma a celek se odmocňuje dvěma podle vzorce 


|‘fi 


+ rii + + 


AQ 

rříklad č. 13. Jednoduchý příklad vypočítávání průměrů. 
Statistická řada skládá se z hodnot: 34, 38, 42, 46. 

34 3H 4- 42 4- 46 


Aritmetický průměr A 


40 


log G = 


Průměr geometrický počítá se nej výhodně] i v logaritmecjh: 
1,531 + 1,579 + 1,623 


— = 1.599 


H 


O = 39,75. 

Průměr harmonický týchž čísel se rovná 
4 4 

“ 0,029 + 0,020 • 0,023 + 0,021 “ 0,099 “ 
Průměr kvadratický týchž čísel .se rovná 


40y04 (zkráceným dělením) 


AQ 


1156 1444 + 1764 + 2116 


j i ^HO 


10,24U 


Pozorujeme, že průměry vypočítávané různým způsobem při správ 
uéin výpočtu příliš se od sebe neliší, je-li rozložení souboru symetrické. 

3. Jinou statistickou charakteristikou je medián, hodnota prostřední. 
Je to hodnota ležící uprostřed, seřadíme-li všechny členy souboru podle 
velikosti znaku kvantitativního, jinak definováno, hodnota, vedle které 
nalezneme v souboru stejné množství hodnot jak vyšších, tak nižších. 

Medián zjistíme snadno, je-li počet členů statistické řady lichý; je-li 
sudý, nahrazujeme jej aritmetickým průměrem dvou prostředních členů. 

Používání mediánu }ná proti aritmetickému průměru některé vý 
hody, z nichž možno jako nej významnější uvésti tyto; 

1. Snadný a rychlý způsob, jakým jej možno zjistiti bez dlouhého 
počítání. 

2. Výhoda, že není případně třeba znáti krajní členy statistické-řady, 
postačí, známe-li pouze počet členů, ovšem za předpokladu, že jsou i ne- 
známí členové uspořádáni podle velikosti. 

3. Malá citlivost, případně necitlivost vůči krajním hodnotám značně 

se odchylujícím od hodnot ostatních. t 

Naproti tomu má medián proti aritmetickému průměru některé 
nevýhody: í 

i. Násobíme-li medián počteni případů, nedostaneme ůphiou radu 
statistickou, takže se medián nehodí pro srovnání dvou statistických rad,. 


2. Necitlivost mediánu vůči krajním hodnotám může býti v někte- 
rých případech opět nevýhodou. 

3. Soubor musí býti dříve uspořádán, údaje musí býti nejprve srov- 
nány podle velikosti. 

4. Medián je nepřesný v případě, jestliže se v řado vyskytuje více 
stejně velkých hodnot. 

Jestliže máme soubor rozdělený ve třídy, je sice snadno zjistiti třídu, 
do které medián spadá, ale je pak ještě třeba zjistiti uvnitř třídy hodnotu, 
která je skutečným mediánem. Výpočet této hodnoty se děje podle 
vzorce: 


Mé = / X 


6 


r c — a 

2 h 


kde I znamená opět rozpětí intervalu, b čet- 


nost třídy, do které medián spadá, c četnosti všech tříd následujících 
této třídě, a četnosti všech tříd předcházejících této třídě. 


Poznámka. Medián z hodnot Xx, označuje se též symbolem x. 

Vedle mediánu používá se někdy ještě podřadnějších hodnot, které 
rozdělují statistickou řadu na více částí, zvláště kvartilů, decilů atd. 

Kvartily nazýváme ony hodnoty, které rozdělují statistickou řadu 
(usměrněnou) na čtyři stejné díly; při tom druhý kvartiJ spadá v jedno 
8 mediánem. Kvartily vypočítávají se podle vzorce 


^ ^ (první kvartil), ^ {třetí kvartil), medián 

^ ^ (současně druhý kvartil). 

4 


Analogického vzorce jako pro výpočet mediánu bylo by třeba po- 
užiti pro výpočet kvartilů: 

pro první kvartil Q, = / x ^ ^ 


a pro třetí kvartil ^ / x 


4/> 

3 {h -f c) — a 

4h 


4. Jiná střední hodnota, často používaná pro soubory obsahující 
znak kvantitativní, je modua čili nejčetnějái hodnota znaku (někdy též 
zv. dominanta). Všeobecně lze ji označiti též jako hodnotu nej Častější, 
neboť podle této střední hodnoty se obyčejně statistický soubor posuzuje. 
Mluvíme-li o průměrné nebo nej častější mzdě dělníků nějaké továrny, 
máme na mysli právě modus, t. j. mzdu, která skutečně největšímu počtu 
dělníků je vyplácena, nikoli aritmetický průměr mezd. Podobně průměrný 
věk žáků nějaké třídy, průměrná velikost vojínů atd. posuzuje se obvykle 
podle modu. 
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Modus má podobné výhody jako medián, zejména je necitlivý vůči 
málo četným krajním hodnotám, dále lze ho použiti i tehdy, jestliže ne- 
známe četnosti všech členů statistického souboru, stačí, víme-li, že ony 
Četnosti jsou menší než četnosti, které známe. 

Nevýhodou modu je nesnadnost jeho přesného určení v případe, že 
znak roste nepřetržitě. Pro výpočet modu existuje řada method, které 
vesměs vycházejí z určitých předpokladů. Nejjednodušší methoda se za- 
kládá na předpokladu, že Četnosti uvnitř třídy jsou rozloženy rovnoměrně, 
potom postačí vžiti za modus střed intervalu třídy s největší četností. 

Jiná methoda záleží v tom, že k dolní hranici třídy s největší četností 
připočteme diferenci d podle vzorce 

. (t'— tt) 

(c — b) — (6 — a), ’ 

kde b značí četnost třídy nejvíce zastoupené, a četnost třídy předcháze- 
jící a c četnost třídy následující. Tuto diferenci násobíme pak opět roz- 
pětím intervalu. 

Také hodnota modu se mění podle toho, jaký interval při původní 
úpravě souboru zvolíme, takže není zcela jednoznačná. 

raklad č. 14. Výpočet mediánu a modu. 

Pronajaté byty o 1 pokoji s kuchyni v Praze r, 1927 (pro nČz bylo sta- 
vební povolení udČleno před 28. 1. 1917) podle výče činže. 

Roční činžovní hodnota činila v Kč*< Počet pronajatých bytů 


do 200 

2.006 

přes 200 do 400 

12.713 

přes 400 do 600 

20.712 

pres 600 do 800 

12.228 

přes 800 do 1000 

4.931 

přes 1000 do 1200 

1.849 

přes 1200 

1.759 


(Upravená tabulka podle Konopáče, Nájemné ve Velké Praze v letech 
1923 až 1930, Praha 1931, str. 17.) 

Z této tabulky rozložení četností vidíme, že třída třetí obsahuje 
v sobě jak medián, tak modus. Předpokládáme-li, že počet bytů uvnitř 
této třídy roste celkem pravidelně s velikostí činže, k čemuž nás oprav- 
ňuje okolnost, že druhá i čtvrtá třída mají téměř stejnou četnost, zjistíme 
přibližnou hodnotu modu aritmetickým průměrem dolní a horní meze 
intervalu třídy třetí, což dává nám hodnotu 600 Kčs. 
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Jestliže použijeme pro yýjiočet modu vzorce výše uvedeudlio, dostaneme 
20,712—12.713 7.999 

' (12.22S~20.712)— (26.712— 12.713) ” — 16.483 ^ ’ ' 

tuto diferenci násobíme intervalem třídním čili 200. 

Modus se pak rovná dolní hranici třídy s největší četností zvětšené 
o takto vypočtenou hodnotu: 

Mo = 400 +'(0,485 X 200) ^ 497 Kčs. 


Poznámka. Modus z hodnot a?,. ífg; ozuaču^je se též íc . 

Medián uvnitř třídy podle vzorce uvedeného na str. 56 se rovná 
h + c ~~ (t 


Mé = / X • 


2b 


_ «. 7 . 2 | 2 ... 7 , 7 -' 4 . 7 "' _ 

2 X 20.712 

Vypočtenou hodnotu přičteme opět k dolní hranici třídy, ve které 
je medián obsažen a dostaneme 

Mé ^ 400 + 129 = 529 Kčs. 

Je-li statistický soubor zcela symetrický, spadají aritmetický prů- 
měr, modus i medián v jedno.. 


II. Charakteristiky rozptylu. 

Rozptylem (dispersí) nazývá se rozložení hodnot souboru v mezích 
daných nejmenší a největší hodnotou (v mezích variačního rozpětí). 
Měrami rozptylu zkoumáme rozložení jednotlivých hodnot znaku. kolem 
hodnot středních. Čím je rozptyl menší, tím jsou hodnoty souboru úže 
seskupeny kolem charakteristiky souboru. 

l. Průměrná odchylka. 

Průměrná odchylka je aritmetický průměr odchylek jednotlivých 
hodnot souboru od některé charakteTÍstiky polohy, nej častěji mediánu^. 
Odchylky zaznamenáváme v jejich absolutní hodnotě, nebot jinak by se 
odchylky positivní a negativní vzájemně zrušily (vyrovnaly). 

— ^^é) + {x^ — Mé) + . . (xř. — Mé) . . • ; •/ 

c\’j] 

jsuu-Ii dány četnosti hodnot znaku /j, /g, /a, /a, /^, . . dohromady 

^ =(^i — Mé) + (a*2 — Mé) /2 + ♦ ■ (^V — Mé) jft • .1 ] 

r 
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2. Smóťodatuá (staudardiii) odchylka. 

Obyčejně se však používá k měření rozptylu směrodatné (standardní) 
odchylky, která se všeobecně označuje řeckým písmenem malým sigma a. 

Směrodatná odchylka je sestrojena v podstatě ňa stejném základě 
jako průměrná odchylka, avšak místo jednoduchých odch3dek hodnot 
bereme za základ čtverce odchylek, které počítáme od aritmetického prů- 
měru souboru, celý průměr se pak odmocňuje dvěma. 




/ (Ji — -f 4- . (gy— 



kde Xi, Xz, Xr atd. značí opět členy souboru a x aritmetický průměr 
jeho, r celkový počet hodnot souboru. 

Jsou-li dány četnosti hodnot statistického souboru, je třeba násobiti 
čtverce odchylek příslušnými četnostmi podle vzorce 

^ ^ 1/ (X^ — X)^ /i 4- (.^2 —~X)^ /o -f (X^ —~X)^ /a -k . . (řTr — xf fr 

I r 


Je-li soubor rozdělen podle kvantitativního znaku rostoucího nepře 
tržitě na třídy, je výpočet směrodatné odchylky ztížen tím, že musíme 
vycházeti od středů tříd, podobně jako tomu bylo při výpočtu aritme- 
tického průměru, tedy od předpokladu, že střední hodnota každého in- 
tervalu je průměrem z hodnot znaku v každé třídě. Dále bychom dostali 
často velmi veliká čísla pro jednotlivé odchylky, kdybychom je počítali 
od skutečného aritmetického průměru pro všechny středy tříd. Proto se 
používá zkráceného výpočtu pomocí prozatímního aritmetického ]u*ů- 
měru, podobně jako při výpočtu tohoto průměru. 

Za základ výpočtu vezme se střed intervalu, do kterého spadá arit- 
metický průměr, ža pomocný aritmetický průměr, a od něho se počítají 
odchylky. Od takto vypočtené směrodatné odchyllcy je třeba ještě ode- 
čísti rozdíl mezi prozatímním průměrem a skutečným aritmetickým prů- 
měrem souboru, vyjádřený v jednotkách intervalu. Poněvadž se celý vý- 
počet děje v jednotkách intervalu, je třeba výsledek násobiti ještě roz 
pětím intervalu. 

Schématický příklad výpočtu priimČrné odchylky. ^ 

Příklad ť. 15. Máme statistický soubor, skládající se ze ělenů j 
19, 26, 26, 28, 32, 33. 40. 

Aritmetický průměr A ^ 29. 
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Odchylky jednotlivých členů od aritmetického průměru jsou 


19 

25 

26 
28 

32 

33 
40 


^3 


10 

4 

3 

1 

3 

4 
11 


2 (^) 


36 


36 


I? = — - 5J42. 

Příklad é. 16. Příklad výpočtu směrodatné odchylky souboru rozděle- 
ného ve třídy pomocí prozatímního průměru (srv. př, c. 12 na str. 62). 

Počet vdaných zen v Čechách 'podle skupin vČku r. 1930, 


Střed 
intervalu 
věkové třídy 

Rozdíl od 
aritmetického 
zat. prúrněru 

Dvoj moc 
rozdílu 

Četnost 

třídy 

Součin 


Č 

e 

/ 

e-f 

17 

-3 

9 

8.629 

77.661 

22 

-2 

4 

118.390 

473.560 

27 

-1 

1 

221.586 

221.586 

32 

0 

0 

240.283 

0 

37 

f 1 

1 

211.308 

211.308 

42 

+ 2 

4 

179.473 

717.892 

47 

+ 3 

9 

158.358 

1,425.222 



2 (/)=>• = 

1,138.027 

= 3,127.229 




3,127.229 

“1,138.027 


= 2,748 




kde Ca značí rozdíl mezi prozatímním aritmetickým průměrem a skuteč- 
ným aritmetickým průměrem. Tento rozdíl se v daném příkladě (v. str. 64) 
rovná Ca = 0,493 jednotek třídních 

= 2,748 — 0,243 = 2,505 


o = j/2,505 = 1,5827, 
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Tento výpočet směrodatné odchylky je značně snazší, než kdybychom 
počítali rozdíly středů intervalů jednotlivých tříd od skutečného arit- 
metického průměru, neboť pracujeme s podstatně nižšími čísly při umoc- 
ňování, násobení i dělení. 

3. Kvartilní odchylka. 

Rozptyl a jeho souměrnost lze jednoduchým způsobem vyjádřit! 
také pomocí vzdálenosti obou kvartilů. Označíme -li kvartily opět pís- 
meny pro první kvartil a pro třetí kvartil, rovná se kvartilní od- 
chylka polovičnímu rozdílu obou kvartilů 

y Ql 

^ o =* • 


4. Koeficient rozptylu (variaČni koeficient). 

Kombinací směrodatné odchylky s aritmetickým průměrem je po- 
měrná míra rozptylu, nazývaná koeficientem rozptylu či variačním koe- 
ficientem : 

K = -4- X 100. 

A 

Tohoto koeficientu se užívá s výhodou ke srovnání rozptylů dvou 
nebo více souborů, neboť vyjadřuje rozptyl v procentech aritmetického 
průměru. 


5. Míry šikmosti rozptylu. 


Rozptyl statistického souboru může býti ještě charakterisován stup- 
něm souměrnosti či nesouměrnosti rozložení okolo hodnot středních. 
Nesouměrnost, šilimost či křivost sklonu křivky rozložení četností (an- 
glický termín pro šikmost rozptylu, často užívaný, je skeumess) vyjadřuje 
se nej častěji srovnáním aritmetického průměru a modu se směrodatnou 


odchylkou souboru: 


>/o 


, t. j. rozdíl mezi aritmetickým průměrem 


a modem se uvádí v poměr ke směrodatné odchylce. Při úplné souměrností 
křivky rozložení spadají aritmetický průměr a modus ovšem v jedno, 
a míra šikmosti se pak rovná nule. 


Literatura ke kap. 6 — 7. Vedle spisů v textu citovaných Janko: Jak vytváří 
statistika obrazy světa. 
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E^apitola 8. 


ČÍSLA POMĚRNÁ A ČÍSLA INDEXNÍ. 


l. Čísla poměrná. 

Vedle čísel absolutních, která vznikají přímo jako výsledek statistic- 
kých šetření a jsou elementární podobou statistických údajů, používá se 
k popisu a rozboru statistických souborů čísel poměrných čili relativních, 
čísly poměrnými nazýváme čísla, která vyjadřují vzájemné vztahy sta- 
tistických údajů. Poměrnými čísly vyjadřujeme tedy buď vztahy mezi 
částí souboru a jeho celkem, nebo mezi různými částmi téhož souboru, 
nebo mezi týmž souborem v různých časových obdobích, nebo konečně 
mezi různými soubory, mezi kterými předpokládáme nějakou logickou 
spojitost. 

Vztah mezi částí souboru, vykazující určitý znak, a mezi jeho celkem, 
takže v čitateli je obsažena část souboru, ve jmenovateli celý soubor, 
nazývá se poměrnou četností znaku (jindy poměrnými četnostmi ana- 
lytickými) a představuje vyjádření poměru empirické pravděpodobnosti. 
Na př. poměr mužů, t. j. jedinců, vykazujících znak mužského pohlaví, 
k počtu všech jedinců, t. j. celému souboru obyvatelstva. 

Poměrná čísla mohou vyjadřovat! též vztah jedné části souboru, vy- 
kazující určitý znak, k jiné části souboru, vykazující jiný znak, na př. 
poměr novorozených chlapců k novorozeným děvčatům (jsou to dvě 
části téhož souboru novorozených dětí).^) 

Poměrná čísla mohou vyjadřovat! též vztah mezi týmž souborem 
v různých obdobích časových, což je jeden a to nejČastější z případů in- 

*) /CoAn .ukazuje, jak tato poměrná čísla mohou býti snadno převedena na 
poměrné četnosti, 1. c. str. Iři. 


dexních čísel, jimž bude vénována druhá část této kapitoly. V tomto pří 
pádě se mluví také o vztazích koordinovaných souborů. 

Poměrná čísla mohou dále vyjadřovati vztahy mezi různými sou 
bory, které sj^olu mají nějakou souvislost, na př. vztah mezi počtem oby- 
vatelstva a rozlohou státního území, na kterém toto obyvatelstvo je 
usazeno. Počet obyvatelstva připadající na jeden čtverečný kilometr 
označuje se obyčejně jako hustota obyvatelstva (v Čechách činil r. 1930 
137, na Moravě a ve Slezsku 133, na Slovensku 68). Jiný příklad: počet 
sňatků nebo úmrtí uvedený v poměr k počtu obyvatelstva. Taková po- 
měrná Čísla nazývají se sňatečností jiebo úmrtností, nejsou však tak přes- 
ná jako poměrné četnosti, i^oněvadž v čitateli je soubor události zachy- 
cený během celého roku, kdežto ve jmenovateli soubor jevů trvalých, 
zjištěných k počátku roku nebo k jinému datu (obyvatelstvo se během 
roku mění porody a úmrtími i migrací). 

vStejnorodé statistické soubory lze spojiti pomocí společného jmeno- 
vatele. Ve statistice se nazývá společným jmenovatelem společná jed- 
notka míry pro rozmanité veličiny, na př. velmi nižné cbmhy zboží v za- 
hraničním obchodě se převádějí na společného jmenovatele pomocí 
jednotky mény, nebot váha různého zboží dohromady sečítaného nedá 
žádného obrazu o zahraničním obchodě, nejvýše o dopravním výkonu, 
potřebném pro tento obchod. 

Jako speciální poměrná čísla se označují poměrná čísla všech uvede- 
ných druhů, ve kterých se část souboru nebo soubor jiného druhu uvádí 
v poměr k dílčímu souboru, ke kterému má věcný vztah, na př. poměrné 
Číslo počtu narozených dětí k dílčímu souboru obyvatelstva, omezenému 
ua ženy ve věku plodném (obyčejně ve věku od 15 — 45 let). Toto spe- 
ciální poměrné číslo se pak označuje jako plodnost proti natalitě (nebo 
porodnosti), které je poměrným číslem obecným (poměr počtu naroze- 
ných dětí ke všemu obyvatelstvu). Takový vztah může býti ještě užším 
vymezováním souboru ještě dále zužován, na př. přidáváním znaku žen 
vdaných, čímž dostáváme ještě užší (a ještě více homogenní) soubor dOčí. 

Poměrná Čísla se vyjadřují bud desetinným zlomkem nebo v procen- 
tech nebo promile, podle toho, položi-li se soubor, ke kterému uvádíme 
jiný soubor ve vztah, rovný 1 nebo 100 nebo 1000. Chceme- li tedy zjistiti, 
kolik procent z čísla X činí číslo 7, násobíme číslo 7 stem a součin dělíme 

(%lem X, zlomek dává nám hledané procento. Podobně zjistíme 

promile obdobným způsobem, návsobíme-li číslo V tisícem a dělíme 
číslem X. 
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2. Ofsla índcxní. 


Zvláštním případem poměrných ěísel jsou čísla indexní. Indexní 
čísla (ukazatelé, z angl. index numbers) jsou čísla, která svými změnami 
a svým pohybem vyjadřují změny souboru jevů, ke kterému jsou v urči- 
tém vztahu. Jindy se definují indexní čísla jako čísla, která svými změ- 
nami charakterisují vzrůst nebo pokles nějaké veličiny (souboru), která 
se sama vymyká přesnému měření. Indexní čísla slouží ke srovnání stej- 
norodých statistických hodnot, a to nej častěji ke srovnání časovému, 
někdy též místnímu nebo věcnému. Pra\’ým účelem indexní ch čísel je 
tedy srovnání. 

Pojem indexních čísel se rozšiřuje často i na poměrná čísla, která 
vyjadřují změny v jediné statistické řado v i^oměru ke zvolené hodnotě 
základní, a taková indexní čísla se nazývají jednoduchými indexními 
čísly, na př. cena pšenice podle záznamů plodinové bursy se srovnává 
každý týden s cenou pšenice, zaznamenanou dne 1. ledna 1930 tím způso- 
bem. že se vyjadřuje, kolik procent z ceny pšenice dne 1. ledna 1930 činí 
cena pšenice v každém Časovém období. Nebo množství uhlí vytěženého 
v každém roce se uvádí stejným způsobem v poměr ke množství vytěže- 
nému v roce, který jsme zvolili za rok základní. Takový jednoduchý 
index se skládá z řady prostých koordinovaných čísel poměrných, vy- 
jadřujících poměr ceny pšenice nebo množství vytěženého ulili ke členu 
základnímu. 

Příkladem indexních čísel ve smyslu uvedených výše definic (nazý- 
vají se též úhrnná indexní čísla) jsou indexy cenové, kde z průměrů změn 
v cenách jednotlivých statků snažíme se vyšetři ti změny v jiném souboru, 
totiž cenové hladině představující kupní sílu peněz nebo životní náklady. 

Obvykle se násobí základní hodnota nebo ]irůměr stem nebo tisícem, 
čhnž dostaneme stejně vyjádřená indexní čísla. 

Při vypočítávání jednoduchých indexních čísel platí to, co bylo uve- 
deno o poměrných číslech. Všeobecně je však třeba pečlivě vybrati základ 
indexů, období nějak zvláště významné a důležité, není-li takového, bere 
se průměr několika období, abychom se vyhnuli možným nahodilým od- 
chylkám. Často řídí se ovšem volba základního období povahou statistic- 
kého pozorování nebo jeho účelem, na př. při indexech cenových bere se 
dosud často za základ poslední mírový rok před první světovou válkou 
se zřetelem na pronikavé změny cenové, které od té doby nastaly. Je-li 
řada uzavřená, konečná, možno vžiti za základ indexních čísel též prů- 
měr všech členů řady. 
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Pokud jde o indexy úhi'rmé, sestrojují se tak, že vypočítává se prů- 
měr z jednotlivých poměrných čísel, vyjadřujících změny v dílcích sou- 
borech, na pr. u československého velkoobchodního indexu se vypočítával 
aritmetický (a též geometrický) průměr ze 69 poměrných čísel, vyjadřují- 
cích poměr cen 69 druhů zboží v určitém měsíci k cenám týchž druhů 
zboží dne 1. července 1914. 

Řetězovými indexy se nazývají taková indexní čísla, kde každé číslo 
se uvádí v poměr k předcházejícímu, takže základna srovnání se mění od 
čísla k číslu (indexní čísla o pohyblivé základně). 

Největšího rozšíření došla indexní čísla ve statistice cenové, neboť 
právě kupní sílu peněz a hladinu nákladů životních lze měřiti jen pomocí 
jich. Toto rozsáhlé používání indexních čísel v cenové statistice vyvolalo 
v theorii i praxi velltou řadu vzorců pro vypočítávání indexních čísel, 
které se zakládají na různých kombinacích poměrných čísel a středních 
hodnot. V praxi převládlo však používání aritmetického nebo geometric- 
kého průměru neváženého nebo váženého. 

Také kriterií správnosti vzorců indexních čísel, zejména zkoušky se 
záměnou času a záměnou činitelů, které sestrojil Irving Fislier,^) se v praxi 
nevalně dbá. 

Přiklad č. 17. Přiklad jednoduchého indexu: 

Téžba kamenného uhlí v letech 1926 — 1935. 


Rok 

Index téžby. 

(demií průměr 

1926 

14,177.134 tu-i 

86,0 

1927 

14,016.330 „ 

87,0 

1928 

14,567.898 „ 

90,0 

1929 

16,548.227 „ 

100,0 

1930 

14,468.519 „ 

86,4 

1931 

13,165.051 „ 

78,8 

1932 

11,032.172 „ 

65,3 

1933 

10,627.357 „ 

63,5 

1934 

10,788.880 „ 

64,1 

1935 

10,894.483 „ 

66,5 


1, Fisher, Tlie making of Index Numbers, N. York 1922, v české literatuře 
podrobněji o kriteriích správnosti cenových indexů a t. zv. zkoušce interkalaco 
Kohn, 1. o. str. 1 14 sl. 


5 Rukovflť statistiky 
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Příklad č, 18. Příklad úhrnných indexních Čísel: 

Index velkoobchodních cen v jednotlivých mČsících r. 1045. 

(ceny jsou zjišťovány vždy k 1, dni každého měsíce, základem jsou ceny, 
zjištěné k 1. červenci 1914 = 100, v 3 rpočteny na základe geometrického 

průměru). 


Měsíc: 


Leden 

1091 

Únor 

1089 

Březen 

1089 

Duben 

1086 

Kveten 

1087 

Červen 

1092 

Červenec 

1105 

Srpen 

1102 

Září 

1111 

Říjen 

1132 

Listopad 

1150 

Prosinec 

1488 

Celoroční průměr 1946 

1214 


Literatura ke kapitole 8. Vedle spisů v textu citovaných Flaskáitvp&r Thoorie 
der Indexzahlen, Berlin 1928, týž Statistik, Meí/er 5 Wórterbůcher, Lipsko 1930, 
WinMer^ Die statistischen Verháltníszahlen, Lipsko 1928, Wagemann Der Narren- 
epiegel der Statistik, Hamburk 1935, Bowley, Eloments of Statistics, 5. vyd. Londýn 
1920, Edgeworih, heslo Index -numbers v Palgrave’8 Dictionnary of PoUtical Econo- 
my TI., Olivier, Les nombres-indicee de la variation des prix, Paříž 1927. 
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Kapitola 9. 


ŘADY ČASOVÉ. 


I. Charakteristika a vyrovnávání časových řad. 

Soubory statistické, které jsou upraveny v časovém sledu statistic- 
kých údajů podle obvyklých jednotek Časových, t. zv. řady časové, vy- 
kazují zvláštní vlastnosti, kterými se odlišují od jiných souborů statistic- 
kých, a které vyžadují zvláštních method analytických. 

Časové řady představují podle své povahy časový vývoj nějakého 
souboru. Tento vývoj může míti různý průběh, který lze zařaditi do 
několika základních typů. 

Ponecháváme-li stranou takové statistické řady časové, jejichž 
pohyb od hodnoty k hodnotě je zcela nepravidelný, můžeme rozezná 
váti tyto hlavní typy: 

1. Typ řad stálých (konstantních), které probíhají tolilso s malým 
kolísáním hodnot, jako je na př. časová řada rozdělení pohlaví u novoro- 
zených dětí (v. př. č. 2). 

2. Typ řad vývojových (evolučních), ve kterých hodnoty vykazují 
stálý vzestup nebo stálý sestup, na př. řada úmrtnosti, natality, vykazo- 
valy v letech předcházejících druhé světové válce trvalý pokles, řada 
počtu obyvatelstva, řada počtu automobilů a j v téže době trvalý vzestup. 

3. Typ řad periodických, které vykazují vzestup a sestup hodnot 
v určitých obdobích se opakující. Nejlépe vynikne tento pohyb při 
grafickém znázornění řady, kde Čára znázorňující řadu vykazuje perio- 
dické klesání a stoupání v podobě vln, na př. řada vyjadřující těžbu uhlí, 
přistavování nákladních vagonů, a jiné řady souborů hospodářské povahy. 

Vývojové řady mohou nabývati různých podob, z nichž některé jsou 
opět charakteristické, zvláště, znázorní me-li je graficky. Jedním z těchto 
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případů je vzrůst řady v podobě paraboly, kde přírůstky řady jsou nej- 
prve velké, pak se zmenáují, takže časová řada se pak ponenáhlu obrací 
ve směr vodorovný. 

Jestliže naopak přírůstky stále stoupají, má časová řada tvar prudce 
stoupající křivky, podobající se písmenu J, Jestliže pak přírůstky nejprve 
stoupají a pak od určité doby klesají, dostáváme řadu, která nejprve 
stoupá pomalu, pak rychle a na konci opět nabývá povahy stálé. Tato 
křivka se označuje též jako křivka logistická, a vyskytuje se často v sou- 
borech jevů demografických a hospodářských, na př. vzrůst ob3rvatel- 
štva, peněžních vkladů u spořitelen a j,, děje se v této podobě (stejnou 
podobu měla t. zv. křivka kumulační, znázorňující rozložení četností 
při stálém přičítání četnosti, srv. př. č. 11 ), 

Podobně jako u řad vzestupných lze i u řad sestupných nalézti po- 
dobné typy, kde se vyskytují obdobné pravidelnosti v úbytcích hodnot. 

Byla nalezena řada met hod, které se snaží vyrovnati časové řady 
empirické na podoby (tvary), které odpovídají některé theoretické formě 
(na př. parabole), jako byly řady nahoře uvedené. 

Methody, jichž se nej častěji užívá k vyrovnání časových řad, jsou: 

1 . methoda pohyblivých prUmértí (klouz%vých príímérit). Časté použití 
její je ve statice konjunktury hospodářské, máme-li řadu hodnot podlé- 
hajících vlivům sezónním (t. j. zmčnám průběhem roku, vzniklým vlivem 
střídání ročních období), a chceme-lí řadu od těchto vlivů sezónních opros- 
tit! . U takové Časové řady, vyjadřující měsíční hodnoty, na př. měsíční 
součty vývozu a dovozu, počet přistavených vagonů, počet nezaměstnaných 
k určitému dni každého měsíce a pod., vypočítávají se při této met hodě 
postupně průměry za dvanáct měsíců, při čemž se přihlíží pouze k polovině 
hodnoty prvního měsíce a připojí se polovina hodnoty měsíce třináctého 
(t. j. prvního měsíce následujícího roku) a tak postupně podle schématu: 

Jsou-li mj, Wg, mg, W 4 , mg, , myi měsíční hodnoty jednoho roku, 

mi3, mi4, .... rw24 měsíční hodnoty druhého roku, vznikne pak 

řada, jejíž první člen je průměr: 

-^tn, -4- 7^3 4-^4 -]-m^ 47«e+w, +^8 +7/^^ 4-rW^3 

12 

pro střední měsíc, t. j. červenec, druhý člen je průměr: 

-fma -bTWg 4 7714 4 mg 47/18 47/^13 4-f mi4 

12 

pro měsíc srpen, a tak postupně dále. 

Rada z těchto průměrů vytvořená zobrazuje pak vývoj konjunktu- 
rální, zbavený sezónních kolísání. 
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Pffklad 5. 19. Mezinárodni indexy nezamlstnanosii 1929 — 1932. 


flí)29 .= 100.' 


naila bez 

vyInuř‘Otií 

Hada fi vi-IaiiPcníra 

Měsíc 

Fczónnicb 

výkyvů 

sozůnnícli 

1 výkyvů 


1!)2Í) 

1 jnao 1 

1 1031 I 

13.12 

1320 1 

í 1330 1 

in.3I 1 

10.32 

Leden 

128 

147 

233 

287 

89 

118 

195 

256 

ťTnor 

131 

163 

236 

289 

89 

125 

200 

261 

Březen • ♦ ♦ 

103 

146 

228 

281 

89 

131 

206 

2GG 

Duben 

86 

141 

214 

276 

90 

138 

211 

269 

Květen ........ 

75 

138 

203 

272 

92 

146 

217 

273 

Červen 

70 

138 

202 

269 

95 

164 

224 

276 

Červenec 

72 

148 

208 

277 

97 

162 

230 

279 

Srpen 

73 

156 

216 

274 

99 

169 

234 

280 

Září ......... 

74 

157 

221 

269 

100 

175 

237 

280 

flíjen 

86 

164 

227 

266 

103 

180 

241 

280 

Listopad 

98 

183 

243 

276 

107 

185 

245 

279 

Prosinec 

124 

209 

268 

289 

112 

190 

251 

273 

Indexy . . 

100 

168 

241 

297 






2. meihoda vyrovnáváni řad cestou grafíclcou (srv. kap. 13.); 

3. meihoda nejmenšich čtverců, Methoda tato záleží v tom, že se zyoÍí 
čára, která se přizpůsobí dané statistické řadě (empirické Ivřivce) do té 
míry, že součet dvojmocí (Čtverců) odchylek od této křivky je minimum, 
t. j. veličina menší než součet dvojmocí odchylek od jakékoli křivky jiné. 

Nej jednodušším případem takové čáry je přímka; může to býti však 
též parabola, exponenciální křivka a j. Podmínky stanovené k určení 
potřebných konstant pro rovnici této čáry jsou: aby součet odchylek 
empirických hodnot (které si představujeme v grafickém znázornění jako 
body sestrojené na dvou kolmých osách, srv. kap. 13.) od příslušných 
bodů hledané čáry byl roven nule, a aby součet čtverců těchto odchylek 
byl minimem. 

Zvolili jsme jako nejjednodušší případ přímku, jejíž rovnice zní 
y a 4- 6a:; je tedy třeba zjistiti konstanty a a 6 v této rovnici. Rovnice 
potřebné pro výpočet těchto konstant, v tomto případě dvě, zvané rov- 
nicemi normálními, získají se sečtením všech rovnic přímky pro všechny 
zvolené hodnoty podle vzorce; 

I. normální rovnice 2* (y) = na bl {x) 

II. normální rovnice 2 {xy) = oa; + 62 (a:^). 
při čemž n znamená opět počet hodnot řady, a tedy též počet sestavených 
rovnic. 
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Příklad č. 20. Časová řada vyjadřující počet obyvatelstva v Německu 
v letech 1871—1910,^) 


1. prosince 1871 

41,06 mil. obyvatel 

1, prosince 1880 

45,23 „ 

1. prosince 1890 

49,43 

1. prosince 1900 

66,37 „ 

1, prosince 1910 

64,93 


Střední hodnotu této časové řady volíme tak, aby vyhovovala pod- 
mínce, že součet odchylek se rovná nule (jako tomu bylo u aritmetického 
průměru), tedy hodnotu pro r. 1890. 

41,06 = a — 196 
45,23 = a— 106 
49,43 = a 
66,37 = a + lOb 
64,93 = a + 206 


257,02 = 5a 4- 6 =1, normální rovnice. 

Druhou normální rovnici dostaneme, když násobíme každou z ho- 
řejších rovnic příslušnou hodnotou x : 

— 780,14 = — 19a -f 3616 (a; = — 19) 

^ 452,30 = — 10a + 1006 {x = — 10) 

563,70 = 10a + 1006 {x = 10) 

1298,60 = 20a + 4006 (x = 20) 


629,86 = a 4- 9616 
Z obou normálních rovnic vyplývá 

a = 51,284 
6 = 0,60206 


II. normální rovnice. 


Rovnice vyrovnané přímky pak zní 

y = 51,284 + 0,60206a;. 

Hodnoty podle této rovnice vyrovnané pro jednotlivé roky časové 
řady jsou (dosadíme příslušné hodnoty veličiny a;): 


Rok 1871 

39,85 

1880 

45,26 

1890 

61,28 

1900 

57,31 

1910 

63,34 


To jsou theoretické hodnoty za předpokladu, že časová řada počtu 
obyvatelstva odpovídá rovnici přímky. 


Winkler^ GrundriO der Statistik, Berlin 1931, I. str. 106. 
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2. Interpolace časových řad. 

Methody pro vyrovnávání řad mohou sloužiti též k výpočtu chybě- 
jících hodnot statistické řady (t. z v. mterpóíace) nebo k odhadu nezná- 
mých, budoucích hodnot řady (t. zv. extrapolace řady). 

Ze známých hodnot statistické řady doplňujeme tedy řadu vypočítá 
nými hodnotami za ty, které neznáme. Jestliže v řadě časové chybí jen 
některý člen (některá hodnota) řady, lze při interpolaci hodnot postupo- 
vat! též jednoduššími methodami než je methoda nej menších čtverců. 

Na př. sčítání lidu se koná u nás pouze jednou za deset let, máme 
však zájem na tom znáti hodnoty časové řady vyjadřující počet obyva> 
telstva též pro roky, kdy se sčítání lidu nekonalo (potřebujeme znáti 
počet obyvatelstva pro výpočet poměrných čísel úmrtnosti, natahty a j., 
jimž za základ slouží počet obyvatelstva v každém roce). Interpolace této 
hodnoty se může státi dvoj ím způsobem, jak patrno z následujícího příkladu. 

Přiklad č. 21. Známe počet obyvatelstva v Československu r. 1921 
(sčítání se konalo 15. února 1921) 13,612.424 obyvatel, a rovněž r. 1930 
(sčítání konalo se 1. prosince 1930) 14,726.158 obyvatel. Předpokládáme-li, 
že vzrůst obyvatelstva mezi těmito roky se děl pravidelně každý rok 
o stejné číslo, čili že obyvatelstva přibývalo řadou aritmetickou, dělíme 
rozdíl mezi oběma hodnotami devíti a dostaneme tak roční přírůstek 
obyvatelstva (rovná se = 123.748). Interpolovaná hodnota jiočtu oby- 
vatelstva na př, pro r. 1926 rovná se pak hodnotě základní, zvětšené 
o pateronásobný přírůstek roční 


13,612.424 -h 5 X 123.748 = 14,231.164. 


Předpokládáme-li však, že poměrný (nikoli absolutní, jako dříve) 
přírůstek obyvatelstva byl každý rok stejný, že tedy obyvatelstvo vzrůs- 
talo řadou geometrickou, musili bychom při interpolaci hodnoty obyva- 
telstva pro r. 1926 postupovat! podle vzorce analogického pro výpočet 
vzrůstu kapitálu při složitém úrokování (připočítávání úroků z úroků): 

h — atf-, kde b značí počet obyvatelstva r. 1930, a počet obyvatelstva 
r. 1921, n počet roků. Z této rovnice vyplývá, že 


n 



a 


Dosadíme-li uvedené hodnoty, dostaneme (pro umocňování a odmoc- 
ňování je nejlépe použiti logaritmů): 


o 
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Obyvatelstvo r. 1926 se pak rovná = 13,612.424 x = 

= 13,612.424 X 1,00878" = 14,220,350, 

Počet obyvatelstva interpolovaný pro r. 1926 za předpokladu, že 
obyvatelstvo vzrůstá každoročně o poměrný stejný přírůstek čili při 
vzrůstu obyvatelstva čím dále tím o větší čísla absolutní, jest ovšem 
o něco menší než interpolovaná hodnota za předpokladu, že vzrůstá 
každoročně o stejné číslo absolutní.^) 

K interpolaci může se použiti též met hody grafické, křivka znázor- 
ňující statistickou řadu a pevně určená známými hodnotami řady umož- 
ňuje nám zjistiti též členy neznámé. 

Při používání hodnot, získaných interpolací, nesmí se zapomenouti, 
že nejsou to hodnoty skutečně získané statistickým šetřením, nýbrž pouze 
hodnoty vypočítané za určitých předpokladů a tedy méně spolehlivé; 
jest zřejmé, že na př. v uvedeném příklade mohla býti pravidehiost 
vzrůstu obyvatelstva během desítiletí porušena, a potom interpolovaná 
hodnota neodpovídá skutečnosti. 

Ijsudek na budoucí hodnoty časových řad statistických, t. j. výpočet 
očekávaných hodnot časové řady v budoucích obdobích časových se na- 
zývá extrapolaci. Extrapolovat! hodnoty je však možno s jistou pravdě- 
podobností pouze pro krátká období časová, neboť předpoklad, že vývoj 
v budoucnosti se bude pohybovat! stejným způsobem jako v pozorované 
době minulé, stává se tím nejistějším, čím vzdálenější je toto budoucí 
období. 

Zvláštní význam mají řady časové ve statistice hospodářské, na 
jejich rozboru se zakládá zejména statistika hospodářské konjunktury. 

Literatura ke kap. 9. Vedle spisů v textu citovaných Mráz: Statistické řady. 
Sborník věd právních a státních XXXII, 1932. 


Při interpolaci hodnot nebylo přihlíženo k okolnosti, že sčítání r. 1921 stalo 
se 16. ťmora, sčítáni druhé 1. prosince. Mezi oběma sčítáními není tedy doba 91otá, 
nýbrž 9 roků a 9 měsíce, Čili 9,7917 let. Podle toho byl by správnější příioístek při 
lineární interpolaci 113.743 a počet obyvatel pro 16. únor 1926 14,181.139. Při 
geometrické interpolaci by se pak n rovněž rovnalo n — 9,7917. Pak by se q rovna* 
lo ^ = 1,00806, Interpolovaný počet obyvatelstva pro 16. únor 1926 byl by pak 
14,170.209. 
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Kapitola 10. 


STATISTICKÉ ZÁVISLOSTI. 


1. Nomologický úkol statistiky. 

Vedle popisného úkolu má statistická methoda úkol analytický nebo 
přesněji nomologický či nomothetický (od řeckého slova nomos, zákon) 
který se neomezuje na popisování a charakterisování souborů a na srov- 
návání statistických údajů, nýbrž hledá též vnitřní závislosti mezi sta- 
tistickými soubory a jejich znaky. Srovnáváme-li počet obyvatelstva 
dvou států, vyjádřený buď v číslech absolutních nebo relativních (hustotu 
obyvatelstva), statistické charakteristiky dvou souborů atd., jde v pod- 
statě stále o úkol popisný, naproti tomu zjíštujeme-li vnitřní vztahy mezi 
národností a náboženským vyznáním v souboru obyvatelstva, mezi pra- 
covní dobou a mzdou v souboru dělnictva, jde o vlastní úkol nomologický. 
Tento druhý úkol statistiky je ještě významnější pro toho, kdo se zabývá 
studiem věd sociálních než úkol popisný. 

Vzhledem k zvláštní logické povaze statistických souborů a statis- 
tické methody nejde ve statistice o hledání závislostí funkčních (poměr 
funkční znamená v matematice, že každé hodnotě veličiny jedné odpo- 
vídá určitá hodnota veličiny druhé — nezávisle proměnné závisle pro- 
měnná), nýbrž o závislost zvláštního druhu, závislost statistickou nebo 
kolektivní. Někdy se mluví též o stochastické závislosti mezi jevy, která 
se zjišťuje statistickou methodou (od řeckého slova stochazesthai, domní- 
vat! se, tušiti). Statistická nebo stochastická závislost je ovšem volnější 
než závislost funkční nebo závislost kausální, neboť se zakládá na pou- 
hém poměru pravděpodobnosti, nikoli poměru nutnosti. Téže povahy 
jsou pak i jednotlivé míry (koeficienty) statistických závislostí. 

Při hledání závislostí mezi kolektivními jevy a jejich znaky je třeba 
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používat! obecných px^avidel logických vedle zvláštních method, které 
poskytuje statistika. Dále je třeba vždy míti na paméti, že ten, kdo chce 
pracovat! statistickou methodou v některém oboru sociálních jevů, musí 
znáti nejen tuto methodu, nýbrž též příslušný obor věd, na př. pracuje-li 
statistickou methodou v oboru jevů hospodářských, znáti též základy 
národního hospodářství. 

2. Závislost mezi znaky kvalitativními. 

Zjistíme-li u nějakého souboru při statistickém šetření dva znaky 
kvalitativní, které označíme písmeny a 5 (na př. národnost česká 
a náboženské vyznání římsko -katolické), můžeme zkoumatí, jsou -li 
tyto znaky nezávislé či závislé. Jsou-li vnitřně nezávislé, znamená to, 
že v souboru existence (přítomnost) znaku A nemá vlivu na existenci 
(přítomnost) znaku 5, přesněji řečeno, že pravděpodobnost znaku A 
nemění se existencí znaku B a naopak. Neni-li tomu tak, nýbrž pravdě- 
podobnost znaku A se zvětšuje nebo zmenšuje přítomností znaku B 
(poměr může býti také opačný), mluvíme o kolektivní nebo stochastické 
závislosti mezi znaky kvalitativními. Při tom může to býti buď přímá 
závislost, jestliže pravděpodobnost znaku jednoho se zvětšuje přítom- 
ností znaku druhého, nebo nepřímá závislost (záporná asociace), jestliže 
pravděpodobnost znaku jednoho se zmenšuje přítomností znaku dimbého. 

Pro zkoumám závislosti znaků kvalitativních jest několik kriterií. 
Všechna se v podstatě zakládají na srovnávání rozdílů mezi poměrnými 
četnostmi dílčích souborů utvořených podle různých znaků kvalitativ- 
ních nebo iDodle různých obměn téhož znaku kvalitativního (methoda 
rozdíln nebo diferenční). Při zkoumání závislosti znaků kvalitativních 
používáme symbolů navržených anglickým statistikem Yulem.^) 

Písmeny A, B označíme přítomnost znaků (znaky positivní); 

písmeny a, p označíme nepřítomnost znaků (znaky negativní); 

písmeny (A), (5) v závorce označíme počet (četnost) případů, vyká 
zujících znaky positivní; 

písmeny (a), (/?) v závorce označíme počet (Četnost) případů, vyká 
zujících znaky negativní; 

písmeny Ai, A 2 , A^ atd. označíme obměny znaku A, písmeny (-ďi), 
{A 2 ), (i^s) v závorce označíme opět analogicky četnost případů, vykazují- 
cích příslušné obměny znaku A . 

Písmenem N označuje se pak počet všech případů (celý soubor). 

Yule^ An introduction to the Thcory of Statistics 11 vyd, Londýn 19.37, Čes. 
překlad 7. vyd. Úvod do therie statistiky, Praha 1926, kap. I — V. 
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Kriterium nezávislosti mezi znaky A 2 ^ B vyjadřuje se pak rovnioemi: 
(AB) _ {Ap) 

(B) (A) ’ 

t. j. poměr počtu případů, kde vyskytuje se jak A, tak B positivně, ke 
všem případům, v nichž se vyskytuje B, musí býti roven poměru počtu 
případů, kde vyskytuje se znak A positivní, a znak B není přítomen, 
k počtu všech případů, kde znak B není přítomen; nebo rovnicí v jiné formě: 



t. j. počet případů, v nichž vyskytuje se jak znak A^ tak znak B^ musí 
býti roven poměru součinu případů, kde vyskytuje se znak A, a počtu 
případů, kde se vyskytuje znak B, k počtu všech případů; nebo rovnici 
t. zv. zkřížených znaků: 

(AB) (aP) ^(aB) (A ^), 

t. j. součin případů, v nichž vyskytuje se znak A i B a případů, v nichž 
nevyskytují se ani znak A ani -B, musí se rovnati součinu případů, v nichž 
vyskytuje se znak B, ale nikoli A , a případů, v nichž vyskytuje se znak .4, 
ale nikoli B, 

Z těchto rovnic dají se odvoditi postupným dosazováním ještě ně- 
které rovnice jiné, kterými lze rovněž zkoumati nezávislost znaků A a, B.^) 

') Z první nahoře uvedené rovnice dají se postupným dosazováním odvoditi 
rovnice; 

(a B) ^ (a /?} 

Tš; ” 

(AB) ^ (uB) 

{A‘i (a) 
i A jg) ^ iafi) 

(A) [a} 

2 druhé nahoi-e uvedené rovnice dají se postupným dosazováním odvoditi rovnice; 

(AB) _ 

(Bi ^ N 

(A B) _ íB) 

[Ai " N 

(AB) _ (A) ^ (B) 

N ' N N 

Tuto poslední rovnici definuje Yule pravidlem: Jsou-U znaky A a, B na. sobě 
nezávislé, pak poměrná četnost současného se vyskytnutí znaků A B ]e rovna sou- 
činu poměrných Četností jednotlivých znaků A a. B. 

Toto pravidlo je založeno na větě o násobeni pravděpodobností, neboť ma- 
tematická pravděpodobnost, Že ^ a B se zároveň vyskytnou, rovná se součinu 
jednotlivých pravděpodobností, jsou -li jevy na sobě nezávislé (viz str. 21). 
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Nejsou-ii však znaky A 3 , B nezávislé, nýbrž je-li mezi nimi závislost, 
vznikají na místé rovnic nerovniny, které ukazují, jaká závislost mezi 
oběma znaky je dána: 


Jestliže (A B) > ^ — 


pravíme, že -á a -B jsou závislé přímo 


(asociovány Idadně), 
jestliže {A B) 


, pravíme, ze A 3 B jsou závislé nepřímo (zá- 


porně sdruženy, disasociovány). 

Přímá závislost mezi dvěma znaky A 3 . B znamená, že počet jevů 
vykazujících znak A a zároveň znak B, převyšuje počet, jaký bychom 
očekávali, kdyby znaky A 3b B byly nezávislé; nepřímá závislost pak, že 
počet jevů, vykazujících znak A a zároveň znak B, jest menší, než jaký 
bychom očekávali, kdyby znaky ^ a -B byly nezávislé. 

Při úsudcích na přímou nebo nepřímou závislost mezi dvěma znaky 
jest však třeba zachovali určitou opatrnost. Jestliže stupeň (intensita) 
asociace jest malý, na př. při uvedeném vzorci levá strana liší se od pravé 
jen o malé hodnoty (v poměru k poctu pozorovaných případů), nelze ještě 
bezpečně usuzovati na závislost obou znaků. Tuto věc lze vj^svčtliti theo- 
reticky tím, že na asociaci působí složitá řada mnoha příčin, jejichž po- 
drobné působení neznáme, a o jejichž výsledku pravíme, že byl způ- 
soben nahodilými okolnostmi nebo kolísáním náhodných výběrů^) (jinými 
slovy náhodou při výběru souboru). 

Jako příklad takové zdánlivé závislosti uvádí Yule.^) soubor, sklá- 
dající se ze zaznamenaných vrhů mincí, při čemž znakem kvalitativním 
je výsledek hodu, zda padl rub ěi líc. 


Příklad č. 22, 

Při 100 pozorovaných dvojic vrhů bylo: 

Při prvním vrhu líc a druhém rub 18 

Při prvním vrhu líc a druhém rovněž líc 26 

Při prvním vrhu rub a při druhém líc 27 

Při prvním vrhu rub a při druhém rovněž rub 29 


Jestliže označíme písmenem A líc při prvním vrhu a písmenem B 
líc při druhém vrhu, máme četnost znaků 

(A) = 44, (B) = 53. 
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*) Yule označuje to jako „fluctuations of sampliiig“, 1. c. str. 31. 
“) Yule 1. c. str. 30. 


(A) (B) 
N 


44 X 53 
100 


= 23,32, {A B) 


{A B) je tedy větší > 


M) (Z?) 


26. 


z čehož bychom mohli usuzovati na přímou závislost mezi oběma znaky, 
t. j. mezi výsledkem prvního hodu a výsledkem druhého hodu, ačkoli pro 
takovou závislost není žádného předpokladu. Takovéto výsledky, zdán- 
livé závislosti, považují se za důsledek nahodilých okolností nebo kolísání 
nahodilých výběrů (pozorování 100 dvojic vrhů možno považovat! za 
nahodilý výběr z velkého souboru vrhů, ve kterém mohou se uplatňovat! 
vlivy náhodné, na př. v uvedeném příkladě způsob, jakým vrháme minci 
a pod.). 


Intensitu závislosti můžeme vedle vzorce uvedeného zkoumati na 
základě rozdílu poměrných čísel, vyjádřených v procentech nebo promile 
podle vzorců: 


{A B) ^ (A) 

{£) " N 

(AB) ^ M/5) 

(B) ^ (yS) 

atd. 


{A B) ^ (B) 

(A) - N 

(AB) ^ (aB) 

(A) ' (a) 


Ze vzorců nej výhodnější pro praktické použití jsou ty, které jednak 
ukazují jasněji stupeň závislosti, jednak osvětlují důležitější stránku 
zkoumaného problému podle povahy statistického materiálu. 


Příklad ě. 23. Závislost mezi hluchoněmosti a slahomyslnosti im základě 
sčítáni lidu v Anglii a Walesu r. 1901.^) 

Úhrnný počet obyv. Anglie a Walesu 32,528.000 (i\^) 


Počet slabomyslných 48.882 [A) 

Počet hluchoněmých 15.246 {B) 

Počet slabomyslných a hluchoněmých 451 (AB) 


Znak slahomyslnosti označme písmenem A, znak hluchoněmosti pís- 
menem B. Vycházíme-li od znaku hluchoněmosti B, t, j. chceme-li přede- 

. -i, u ^ (AB) (A) 

vsím z]istiti poměry mezi hluchoněmými, použijeme vzorce — ^ 

^ 29 , 60 /„„ > 1 , 50 /... 


M Yide 1. c. str. 33. 
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Vycházíme-Ii od znaku slabomyslnosti A, t. j. chceine-Ii především 
zjisti ti poměry mezi slabomyslnými, použijeme vzorce 

{A B) ^ (B) 

{A) N 

ISTiST 32,528.000 ■ 0>2O/„o > 0,50/,,. 

Srovnání závislosti znaků jest v obojím případě velmi názorné a uka- 
zuje značný stupeň závislosti. 

Příklad č. 24. Závislost mezi 'pohlavím a 'ámrtnosti. 

Podle sčítání lidu z r. 1930 bylo v Cechách r. 1930 
mužů 3,452.123 
žen 3,657.253 
úhrnem všeho obyvatelstva 7,109.376 
zemřelo téhož roku 

mužů 49.398 
žen 46,199 
úhrnem zemřelo 95.597. 

Označíme-Ií pohlaví mužské písmenem .4, úmrtí písmenem B, podává 
se pro srovnání závislosti mezi pohlavím a úmrtími jako nej výhodnější 
vzorec, který přímo ukazuje poměrnou četnost zemřelých mužů v souboru 
mužů vůbec a zemřelých žen v souboru všech žen. 

(A B) (aB) 

{A) ' (a) 

49.398 46.199 

3,452.123 ^ 3,657.263 
vyjádřeno v promile (na tisíc obyvatel) 

14,300/oo > 12,620/oo, 

je tedy dána přímá závislost mezi pohlavím mužským a úmrtími. 

Srovnáme -li úmrtnost mezi muži s úmrtností mezi veškei-ým oby 
vatelstvem podle vzorce 

{A B) (B) 

(A) ^ N ’ 

kde {B) značí veškerá úmrtí v Cechách r. 1930 (95.597) a N veškeré 
obyvatelstvo Cech (7,109.376), dostaneme nerovninu 
14,300/oo > 13,440/00. 

Také tento poměr ukazuje, že oba znaky jsou závislé, je však méně 
výrazný než nahoře uvedený. 
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Pochybnost, zda rozdíl mezi poměrnými četnostmi ukazuje skuteč- 
nou závislost mezi znaky, či zda je pouze náhodný, je možno řešiti pomocí 
výpočtu theoretické střední odchylky rozdílu mezi poměrnými četnostmi. 
Jestliže rozdíl mezi poměrnými četnostmi převyšuje aspoň trojnásobek 
theoretické střední odchylky, považuje se obvykle nahodilost za vylouče- 
nou a rozdíl takový za spolehlivého ukazatele závislosti mezi znaky. 

Pro výpočet theoretické střední odchylky rozdílu platí vzorec: 

,, = 1/Kiri ilul, 

» Til ^ 

t, j. rovná se odmocnině součtu čtverců theoretických středních odchylek 
obou poměrných četností. Matematickou pravděpodobnost a g 
nahradíme opět pravděpodobností empirickou, takže dostaneme vzorec: 




/^l 

, \ 

mo í 

/ »l ^ 

n, J 

^2 ^ 



V uvedeném příkladě č. 24 dosadíme hodnoty: 


Od 


=f» 


,01430 X 0,98570 , 0,01262 x 0,98738 


3,452.123 


-h 


3,657.253 


= 0,0000864. 


Trojnásobek této theoretické střední odchylky 3 Pd = 0,0002592. 
Rozdíl poraěrnýcii četností je větší než trojnásobek střední odchylky 
1,680 /q^j ^ 0,00168 > 0,0002592. 

Rozdíl mezi poměrnými četnostmi, ač není velký, můžeme tedy 
považovat! za spolehlivé kriterion přímé závislosti mezi pohlavím muž- 
ským a úmrtností. 

K měření velikosti závislosti (asociace) mezi znaky používá Yule 
zvláštního vzorce, který nazývá koeficientem asociace a označuje písme- 
nem Q podle začátečního písmena jména Quételetova. Poněvadž písmenem 
Q se označuje rovněž divergenční koeficient LexisUv, o němž bude řeč 
v kapitole o náhodných výběrech, používáme na rozlišení od tohoto 
koeficientu písmena Q s indexem as (asociace). 

Tento koeficient asociace se rovná; 

(v čitateli je rozdíl, ve jmenovateli součet zkřížených znaků). 

Jeden krajní případ nastává, jestliže (Ap) (aB) = 0 , potom se 
koeficient rovná Qas = 1* Tento případ se nazývá úplnou asociací, a jsou 
to případy, kdy všechna A jsou B nebo naopak. 
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Druhá mez je případ, jestliže (AB) (a^) =0, potom koeficient 
rovná se Qqr = — 1. Tento případ se nazývá úplnou disasociací, a jsou 
to případy, kdy žádné A není B nebo naopak. 

Koeficient asociace může býti považován za míru závislosti dvou 
znaků kvalitativních; čím více blíží se +1, tím je přímá závislost vyšší, 
čím více blíží se — 1, tím je nepřímá závislost vyšší; blíží-li se nule, nelze 
usuzovat! na závislost. To vše platí opět s výhradou nahodilých shod, 
které se mohou projeviti zejména při menším počtu pozorování.^) 

V příkladě výše uvedeném o závislosti mezi hluchoněmostí a slabo- 
myslností na podldadě statistických údajů ze sčítání lidu v Anglii a 
Walesu (v. př. č. 23) rovná se koeficient asociace Qas = +0,91, je tedy 
značně vysoký. 


Příklad c. 25. Závislost mezi muzshjm pohlavím a bezkonfcsností. 

Při sčítání lidu r. 1921 zjištěno bylo v Československu mužů bez 
vyznání 417.319, žen bez vyznání 307.188, všech mužů bylo 0,559.503, 
všech žen bylo 7,053.669; tážeme se, jakého stupně je závislost mezi 
mužským pohlavím a bezkonfesností? 

Označíme písmenem A pohlaví mužské, písmenem B bezkonfesnost; 
potom dostaneme četnosti: 

(A) = 6,559.503, (a) = 7,053.669, 

(AB) = 417.319, (a£) = 307.188. 

Četnosti ve vzorci ještě potřebné snadno odvodíme dosazením ze zná- 
mých četností: 

(A^) = (A) — (AB) = 6,559.503 — 417.319 = 6,142.184, 

(ojd) = (a) — (oB) == 7,053.669 — 307.188 = 6,746.481. 


_ {A B) (a p) - (A P) (a B) 

(AB)(a^) +(Afi)(aB) 

(417.319 X 6,746.481) — (6,142.184 X 307.188) 

(417.319 X 6,746.481) + (0,142.184 X 307.188) 

928.629,485.847 , 

— ~ O 197. 

4„702.239, 923.031 


') Pro výpočet stupně závislosti mezi znaky kvalitativními používá se ještě 
jiných vzorců, jako je Pearsonfiv koeficient kontingonce a Oini-lio koeficient po- 
dobnosti, avšak žádný z uvedených vzorců nelze považovat! za tak přesný, aby 
Číslo koeficientu mohlo býti považováno za přesvědčivý stupeů asociace. O tom, jak 
naopak tyto vzorce mohou vést i k nesprávným výsledkům a jak jsou závislé na zastou- 
pení znaků v souboru srv. Zdání a skutečnost ve statistice, Praha 1935. Pro 

statistickou praxi možno se spokoj iti hrubší methodou diferenční, nahoře vylíčenou. 
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Je tedy z příkladu patrná přímá závislost mezi znakem „mužské 
pohlavť* a znakem „bezkonfesnost" v souboru obyvatelstva, stupeň zá- 
vislosti není však velký. 

Dělí-li se znak kvalitativní na více než dvě obměny, jako je tomu 
na př. při znaku národnosti, náboženského vyznání a pod., mluvíme 
o množném třídění znaků na rozdíl od třídění dvojdílného ci dichoto- 
mického, jako byly případy probírané. 

V takových složitých případech postačí pro běžnou statistickou 
praxi vyjádřiti poměrné četnosti pro jednotlivé obměny znaku jednoho 
v kombinaci s příslušnými obměnami znaku druhého a srovnávat! opět 
rozdíly mezi poměrnými četnostmi. 

Takové srovnání děje se obyčejně úpravou souboru do tabulky podle 
obměn obou znaků. 

Příklad č. 26. Znalost Čtení a opsaní podle národnostních skupin. 



Čechy r. 1930: 


Národnostní skupina 

z 1000 mužů 

z 1000 žen 


starších deseti let neumělo ani číst ani psáti 

československá 

9,8 

16,6 

německá 

7,9 

11,1 

ze všeho obyvatelstva 

9,7 

14,9 


Slovensko r. 1930: 


československá 

62,6 

91,5 

ruská (ukrajinská) 

245,3 

341,7 

německá 

35,4 

50,3 

maďarská 

44,1 

55,6 

ze všeho obyvatelstva 

67,5 

94,5 


Poměrné četnosti můžeme srovnávat! jednak mezi jednotlivými 
skupinami, jednak s poměrnými četnostmi pro veškeré obyvatelstvo. 
Kdežto v Cechách rozdíly mezi poměrnými četnostmi mezi skupinou 
československou a německou nebyly příliš výrazné, byly na Slovensku 
tyto rozdíly zřejmé a ukazují závislost mezi příslušností k ruské (ukrajin- 
ské) národnosti a částečně též československé národnosti a negramotností. 
Rovněž se objevuje závislost mezi ženským pohlavím a negramotností a 
to u všech národnostních skupin a ovšem i v úhrnu obyvatelstva. Ovšem 
v úsudcích je třeba opatrnosti, neboť závislosti ty mohou býti do jisté 


6 RlikovSť Ktatlstlky 
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míry zprostředkovány znaky jinými, na př. velká většina příslušníků 
ruské (ukrajinské) národnosti na Slovensicu žije ve venkovských obcích 
a živí se zemědělstvím a lesnictvím, závislost může tedy býti ve velké 
míře zprostředkována znaky místního usídlení a příslušnosti k povolání. 

Zdánlivá asociace bývá často způsobována t. zv. asociací dílčí (par- 
ciální), t. j. tím, že závislost mezi dvěma znaky zprostředkována je zá- 
vislostí na znaku třetím. Na př. při celkovém srovnávání úmrtnosti pří- 
slušníků různých povolání může býti závislost mezi úmrtností a některým 
povoláním způsobována vlivem znaku třetího, t. j. věku příslušníků 
těchto povolání, který je různý, poněvadž vyšší věkové třídy jsou za- 
stoupeny u jednoho povolání četněji než u druhého a důsledkem toho je 
též jejich vyšší úmrtnost. Závislost mezi znaky je tedy způsobována dílci 
asociací se znakem třetím, povahy kvantitativní, věkem. 

Je-li takový další znak obsažen ve statistických údajích, je třeba 
při zjišťování závislosti mezi znaky též k němu prihlížeti tím, že roztří- 
díme statistické údaje nejprve podle tohoto třetího znaku C, jinak aspoň 
pamatovat! na to, zda zjištěná závislost nemůže takovým způsobem 
vzniknoutí. 

Vzorec platný pro zjištění závislosti dvou znaků A & B y souboru 
případů C zní: 

(AC) (BC) 

{ABC) > - — je-li závislost přímá, a 

(ABC) < - je-H závislost nepřímá. 

Obdobným způsobem, jako jsme usuzovali na závislost mezi ob- 
měnami dvou znaků kvalitativních z rozdílů poměrných četností, může- 
me postupovat! též při posuzování závislosti mezi dvěma znaky kvali- 
tativními (v následujícím příkladu č. 27 mezi úmrtností a legitimitou), 
při čemž však celý soubor je rozdělen ve skupiny podle znaku kvanti- 
tativního (věku), čímž je umožněno jemnější srovnávání v jednotlivých 
skupinách. 

Uvádíme příklad dánského statistika Westergaarda?) o zkoumání 
závislosti mezi úmrtností dětí a jejich legitimitou, poněvadž dobře 
ukazuje potřebu podrobnějšího rozboru, dříve než utvoříme si úsudek 
na závislost mezi znaky. 

Westergaard -Nyhollet Grundzúge rler Theorie der Statistik, 2 vyd., 1928, 
8tr. 509. 
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Příklad ě. 27. Úmrtnost dlv&ai ve véku do péti let podle původu 
v Dánsku v letech 1911 — 1915, 


Vdková skupina 

0 — 1 měsíce 

1 — 3 měsíce 
3 — 6 měsíců 
6 — 12 měsíců 

1 — 2 roků 

2 — 3 roků 

3 — 4 roků 

4 — 5 roků 


děti manželské 
328 %o 

%o 
67 %o 
42 %Q 

13 %o 

6%o 

4%o 
3 %o 


děti nemanželské 
631 %o 

221 %o 

144 %o 
73 %o 

18 %o 
6%o 

3%o 

2%o 


Z rozdílů poměrných četností jednotlivých skupin věkových lze 
bezpečně souditi, že úmrtnost nemanželských dětí v nej nižších věkových 
stupních jest větší než úmrtnost dětí manželských; naproti tomu nelze 
souditi bezpečně o starších ročnících dětí, nebot v důsledku pozdějších 
legitimací ubývá dětí nemanželských a přibývá manželských, nikoli však 
naopak. Děti později legitimované a pak zemřelé připadají pak ovšem 
k tíži úmrtnosti dětí manželských. 

Je zde tedy závislost mezi znakem illegitimity dětí a jejich úmrtností 
(resp. závislost nepřímá mezi legitimitou dětí a úmrtností) v nej nižších 
věkových skupinách; poněvadž se však soubor sám uvnitř ve vyšších 
věkových skupinách mění, při Čemž změny ty nemůžeme zjistiti, ne- 
máme-li pro ně též údajů o legitimacích, nelze z něho činiti závěrů plat- 
ných pro celý soubor. 
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Kapitola 1 1 


ZÁVISLOST MEZI ZNAKY 
KVANTITATIVNÍMI (KORELACE). 


1. Pojem korelace a srovnávání statistických rad. 

Závislost mezi znaky kvantitativními, pro kterou se vžilo označení 
korelace (též souvztažnost, ko variace) se zjišťuje a měří zvláštními metho- 
dami podle zvláštní povahy kvantitativních znaků. 

Obdobně jako závislost znaků kvalitativních znamená závislost 
znaků kvantitativních, že s měnícími se hodnotami znaku jednoho mění 
se rozložení a pravděpodobnost znaku druhého. Znaky jsou přímo (klad- 
ně) korelovány, jestliže se vzrůstem hodnot jednoho znaku stávají se 
pravděpodobnějšími vysoké hodnoty druhého znaku, a nepřímo (zápor- 
ně) korelovány, jestliže se vzrůstem hodnot jednoho znaku stávají se 
pravděpodobnějšími nízké hodnoty znaku druhého. Při tom opět není 
to závislost pevná, funkční, kde by každé hodnotě znaku jednoho odpo- 
vídala jediná určitá hodnota znaku druhého, nýbrž zvláštní závislost 
kolektivní, vlastní kolektivním souborům, kde každé hodnotě znaku 
jednoho odpovídá opět řada možných hodnot znaku druhého, a vztah 
mezi znaky jest opět jen pravděpodobný. 

Primitivním způsobem lze zjiěťovati závislost mezi znaky kvanti- 
tativními tak, že prostě sledujeme, jak se mění (rostou nebo se zmenšují) 
kvantitativní znaky ve dvou statistických řadách (obyčejně časových). 
Tento způsob nazýváme srovnáváním statistických řad. Jestliže hodnoty 
jednoho znaku se mění souhlasně s hodnotami znaku druhého, mluvíme 
o souběžnosti ('paralelismu) řad, jestliže se mění opačně než četnosti 
znaku druhého, o protichúdnosti (antagonismu) řad; zvláště názorně se 
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projevují tyto pohyby při grafickém znázornění v podobě dvou čar na 
diagramu. 

Z paralelismu nebo antagonismu řad se pak usuzuje, ovšem jen zcela 
zhruba, na přímou nebo nepřímou závislost znaků v řadách těch obsaže- 
ných. 

Takovými primitivními methodami hledána byla závislost mezi 
cenou žita, jako měřítka ceny nejnutnější životní potřeby Širokých 
vrstev obyvatelstva, a mezi úmrtností nebo kriminalitou, vyjádřenou 
poměrnou četností přestupků krádeže, jako měřítka Icriminality těchto 
vrstev; vše to sledováno v řadách časových. 

Poznámka. S/*v. již historické pojednání B. Weisz: ,,Ober einige wirtschaftli- 
che imd moralische Wirkiingen hober Gefcreidepreise,“ Conraďs Jahrbiicher, N. 
F. III/ 1881 , často citované v učebnicích statistiky. 

2. 3Iěreiií korelace korelačními tabulkami. 

Korelaci mezi znaky kvantitativními můžeme zkoumati jednak 
(předběžně) t. z v. korelačními tabulkami, jednak vyjádřiti ji přesně 
pomocí některých vzorců. Korelační tabulka sestavuje se tím způsobem, 
že se pozorovaný soubor upravuje v tabulku současně se zřetelem k obě- 
ma znakům v něm obsaženým tak, že se jednotlivá pozorování třídí podle 
hodnot znaku jednoho nebo podle tříd četností tohoto znaku, a současně 
zařazují do tříd znaku druhého. Každá hodnota souboru je takto za- 
řazena zároveň do příslušné třídy znaku jednoho a do příslušné třídy 
znaku druhého. 

Příklad č. 28. Korelace mezi vlíkem vdaných zen a počtem dčti, které se 
v nynějším manželství narodily (Slovensko r. 1930). 

V této korelační tabulce se objevuje rozložení charakteristické pro 
přímou kladnou korelaci obou znaků, neboť nej vyšší třídní četnosti se- 
stupují s levé strany tabulky sliora k pravé straně dolů, seskupeny kolem 
diagonály. Zároveň je to příklad, třeba ne dokonalý, t. zv. korelace li- 
neární, t. j. takové, kde největší hustoty četností lze přibližně vyrovnati 
přímkou a vyjádřiti též analytickou rovnicí přímky (přímka tato se na- 
zývá podle Oaliona ,, regresní přímkou“). Při korelaci záporné, nepřímé, 
postupují třídní četnosti vzestupně od levé strany tabulky zdola k pravé 
straně vzhůru. Není-li pravidelnosti v rozložení největší hustoty čet- 
ností, takže je nelze vyrovnati přímkou, mluvíme o korelaci nelineární. 

Při sestrojování Icorelačních tabulek je opět dbáti pravidla, že inter- 
valy mezi třídami musí býti rovné. 
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Korelace mezi trváiiim manžehtvi xidanýck zen a počtem dčíi 
Počet vdaných žen, kterým se v nynějším 


Trvání 
manželství 
v dokonče- 
ných letech 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0-4 

50.444 

52.943 

23.676 

6.098 

966 

146 

13 

1 





6-9 

16.788 

26.398 

37.226 

27.426 

14.819 

6.943 

1.893 

616 

167 

39 

1— 1 

1 

O 

10.367 

11.064 

19.666 

20.615 

18.547 

13.812 

8,121 

3.643 

1.419 

639 

16-19 

6.207 

4.646 

7.243 

7.886 

8.090 

7.403 

6.283 

4.660 

3.123 

1.700 

20-24 

4.626 

4.434 

6.667 

7.664 

7.690 

6.987 

6.327 

6.360 

4.223 

3,053 

25-29 

3.336 

3.162 

4.905 

6.704 

6.005 

6.666 

5.277 

4.616 

3.912 

2.963 

30-34 

2.663 

2.567 

3.844 

4.786 

5.205 

5.142 

4,844 

4.252 

3.817 

3.198 

35 a více 

4.404 

4.083 

6.010 

7.340 

8.322 

8.328 

8.466 

7.761 

7.202 

6.014 

Úlim . . . 

96.724 

108.287 

109.116 

86.519 

69.635 

53.426 

41.224 

30.577 

23,863 

17.506 


Pramen: Cs. staiistilca, sv, 126 ^ sir. 26. Případy, zahrnuté v rubrikách 


3. Koeficient korelace a korelační pomčr. 


Nej častě] i užívaným vzorcem pro měření korelace, který se hodí 
ke zjištění a měření lineární korelace mezi dvěma znaky, je t. z v. Pear- 
sonúv koeficient korelace, označovaný písmenem r, který se zakládá na 
srovnávání směrodatných odchylek obou variabilních znaků. Jeho 


vzorec je: r 


^{xy) 

N Ox o„ 


, ve zkrácené úpravě : r = 


2* {x y) 


kde X znamená odchylky jednotlivých hodnot jednoho znaku od aritme- 
tického průměru celé řady těchto hodnot, y odchylky hodnot druhého 
znaku od aritmetického průměru celé řady hodnot tohoto druhého zna- 
ku. Tento vzorec je zjednodušený tvar korelačního koeficientu, za jehož 
základ bereme aritmetický průměr. Původní vzorec se zakládá na od- 
chylkách hodnot pozorovaných (empirických) od hodnot vypočtených 
(theoretických) na základě vyrovnaného souboru methodou nej menších 
čtverců. 


Koeficient korelace se pohybuje mezi 0 a 1 v případě korelace kladné 
a mezi 0 a — Iv případě korelace záporné. 
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iiv^ narozených v tomto manželství na Slovensku r, 1930. 
manželství živě narodilo dětí: 


10 

11 

12 

13 

14 

IB 

16 

17 

18 

19 

20 

a více 

Úhm 












133.176 

13 

2 










129.229 

237 

72 

47 

22 

6 

- 

2 

1 

- 

— 

- 

108.059 

899 

3G5 

179 

76 

30 

12 

9 

- 

1 

— 

- 

67.801 

1.981 

994 

640 

241 

111 

64 

28 

11 

7 

6 

4 

60.986 

2.119 

1.339 

775 

40G 

194 

96 

61 

12 

12 

3 

4 

60.456 

2.270 

1.490 

1.002 

444 

272 

120 

48 

22 

16 

1 

3 

46.995 

4.791 

3.130 

2.387 

1.110 

633 

288 

160 

47 

35 

13 

20 

80.624 

12.310 

7.392 

6.030 

2.298 

1.245 

670 

288 

93 

70 

22 

31 

666.226 


ozTUičených y,nendáno^\ pro oba znaky ^ byly vypuštěny. 


Ke zjištění, zda koeficient korelace, ke kterému jsme výpočtem do- 
spěli, lze považovat! za spolehlivé měřítko ci zda vyjadřuje pouze na- 
hodilé okolnosti, slouží opět srovnání s theoretickou střední odchylkou 
tohoto koeficientu. Theoretická střední odchylka Pearsonova koeficien- 


1 — r2 

tu se rovná or = — — , kde iV' znamená počet párů pozorovaných pří- 
padů. 

Aby bylo možno koeficient korelace považovat! za spolehlivého 
ukazatele závislosti dvou znaků kvantitativních, vyžaduje se obvykle, 
podobně jako tomu bylo u jiných poměrů, aby koeficient byl větší než 
trojnásobek jeho theoretické střední odchylky. 


Také tehdy, jestliže zjistíme vysoký stupeň korelace (korelační 
koeficient je zlomek, blížící se jedničce), je třeba si uvědomit!, že ze sta- 
tistické závislosti nelze ještě souditi na vztah příčinný a že závislost 
mezi dvěma znaky může býti zprostředkována závislostí na znaku 
jiném. 

JestUže je statistický soubor rozdělen podle znaku kvantitativního 
ve třídy, vycházíme při výpočtu korelačního koeficientu obdobně od 
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Korelace mezi trváním manždstvi vdaných žen a počtem dčti 
Počet vdaných, žen, kterým se v nynějším 


Trvání 
manželství 
v dokonče- 
ných letech 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0-4 

60.444 

52.943 

23.576 

5.09e 

956 

146 

13 

i 




9 

6 

3 

0 

3 

6 

9 

12 



6-9 

15.788 

26.398 

37.226 

27.426 

14.819 

6.943 

1,893 

515 

167 

39 


6 

4 

2 

0 

2 

4 

6 

8 

10 

12 

10-14 

10.367 

11.054 

19.656 

20.616 

18.547 

13.812 

8.121 

3.543 

1.419 

639 


3 

2 

1 

0 

1 

2 

3 

4 

5 

6 

15-19 

5.207 

4.646 

7.243 

7.886 

8.090 

7.403 

6.283 

4.650 

3.123 

1.700 


0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

20-24 

4.626 

4.434 

6.667 

7.664 

7.600 

6-987 

6.327 

5.350 

4.223 

3.053 


3 

2 

1 

0 

J 

2 

3 

4 

5 

G 

25-29 

3.336 

3.162 

4.905 

6.704 

6.006 

5.665 

5.277 

4.516 

3.912 

2.963 


6 

4 

2 

0 

2 

4 

G 

8 

10 

12 

30-34 

2.653 

2.667 

3.844 

4.786 

6.206 

5.142 

4.844 

4.262 

3.817 

3.198 


9 

6* 

3 

0 

3 

(j 

.9 

12 

7á 

IS 

35 a více 

4.404 

4.083 

6.010 

7.340 

8.322 

8,328 

8.466 

7.751 

7.202 

6.014 


12 

8 

4 

0 

4 

8 

12 

16 

20 

24 

Úhrn, , .| 

96.724 

108.287 

109.11C 

86.619 

69.635 

53.426 

41.224 

30.677 

23.863 

17.506 


středů tříd, jako jsme učinili při výpočtu směrodatných odchylek u ta- 
kových souborů. Další postup záleží v tom, že se korelační tabulka, ve 
které je soubor rozložen, rozdělí na čtyři pole tím, že se ony třídy, do 
kterých spadá aritmetický průměr řady x a řady y, označí jako pomocný 
prozatímní bod, od kterého vycházíme (podobně jako tomu bylo u pro- 
zatímního aritmetického průměru). Dostaneme tím rozdělení tabulky, 
podle kterého vypočítáváme odchylky tříd od tříd pomocných a pak je 
vzájemně násobíme, abychom dostali potřebnou veličinu Z (xy) pro 
vzorec koeficientu korelace. 
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zM narozených v tomto manželství. 
manželství živě narodilo dětí; 


10 

11 

12 

13 

14 

16 

16 

17 

18 

19 

20 

a více 

Úhrn 












133.176 

13 

2 

_ 

— 


— 

_ 

_ 


_ 

_ 

129.229 

14 

16 











237 

72 

47 

22 

6 

— 

o 

1 

_ 

— 

— 

108.059 

7 

8 

9 

10 

11 

12 

13 

14 





899 

365 

179 

75 

30 

12 

9 

— 

l 

_ 

— 

57.801 

0 

0 

0 

0 

0 

0 

0 


0 




1.981 

994 

640 

241 

111 

54 

28 

11 

7 

5 

4 

60.986 

7 

8 

9 

10 

11 

12 

73 

14 

15 

16 

17 


2.119 

1.339 

776 

406 

194 

96 

51 

12 

12 

3 

4 

50.456 

14 

16 

18 

20 

22 

24 

26 

23 

36 

32 

34 


2.270 

1-490 

1.002 

444 

272 

120 

48 

22 

16 

1 

3 

45.995 

21 

24 

27 

30 

33 

36 

39 

42 

45 

48 

57 


4.791 

3.130 

2.387 

1.110 

633 

288 

160 

47 

35 

13 

20 

80.624 

28 

32 

36 

40 

44 

48 

52 

56 

60 

64 

68 


12.310 

7.392 

6.030 

2.298 

1.246 

570 

288 

93 

70 

22 

31 

666.226 


Výpočet korelačního koeficientu předvedeme na schematickém 
příkladě: 

Příklad č. 29: 

budtěž dány hodnoty znaku a; 1, 2, 3, 4, 5 
a hodnoty znaku y 2, 5, 3, 8, 7, 
potom aritmetický průměr znaku x A ^ = 3, 
aritmetický průměr znaku y Ay = 5, 
směrodatná odchylka znaku x ox — 1,4^1, 
směrodatná odchylka znaku y Oy = 2,28. 
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Další postup je: 


hodnoty 

znaku 

odchylky od aritme- 
tického průměru 

dvojmoci odchylek 

součin 

odchylek 

X y 

X 

y 



xy 

1 

2 

-2 

-3 

4 

9 

+ 6 

2 

5 

-1 

0 

1 

0 

0 

3 

3 

0 

-2 

0 

4 

0 

4 

8 

-1-1 

+3 

1 

9 

+3 

5 

7 

+ 2 

+ 2 

4 

4 

+ 4 


(x^) = 10 2^ (í/2) = 26 2 (xy) = 13 

13 


0,809. 


5 X 1,41 X 2,28 

Můžeme tento koeficient korelace srovnat! s jeho směrodatnou 
odchylkou: 

1 0,6545 0,3455 


a - = 


= 0,154. 


1/jV 5 2,236 

3 Or se rovná = 0,462, je tedy korelační koeficient větší než troj- 
násobná (a zřejmě i než pětinásobná) jeho směrodatná odchylka, což se 
podle konvence považuje za dostatečný průkaz jeho spolehlivosti. 

Výpočet korelačního koeficientu v př. č. 2S; 

Třídy, do kterých spadá aritmetický průměr, t. j. třídu 3 u znaku 
X a třídu 15 — 19 u znaku y zvolíme za základní pomocný bod a označíme 
nulou 0. (To ovšem předpokládá, že dříve zjistíme arit;metický průměr 
obou řad, = 3,408 (dětí) Ay = 16,115 (let), a dále též směrodatně 
odchylky a = 2,333 třídních jednotek neboli dětí, ježto třídní interval 
pro X — Oy = 2,394 třídních jednotek neboli 11,97 let, ježto třídní 
interval pro y — 6.) Vzdálenosti a Cy udávají nám vzdálenosti arit- 
metických průměrů od základního pomocného bodu tabulky. 


Vzdálenost ^ — 3,408 = — 0,408. 

Vzdálenost Cj, = 17,5 — 16,115 = 1,385, obojí vzdálenosti jsou vy- 
jádřeny v jednotkách třídních. 

Součin Oa: Oy = —0,408 x 1,385 = 0,665. 

Dále je třeba vypočítat! xy, t. j. součin vzdáleností středů tříd od 
středu základní pomocné třídy 0. Tyto součiny jsou v tabulce tištěny 
ležatým písmem. Pro každou třídu je třeba součin ještě násobiti přísluš- 
nou četností. Při tom, je-li řada uspořádána od shora dolů vzestupně 


90 


(pro ?/) a s levé strany do pravé rovněž vzestupně (pro a;), jak je zvykem, 
dostaneme čtyři pole, rozdělená oběma osami kolmými, které tvoří tří- 
dy, jež jsme učinili pomocnými body, a označili jako 0, podle schématu: 


y 



3 

ni {+) 

IV {-) 

-5 -4 -3 -2 -1 

1 1 1 1 1 1 

1 

-1-1 +2 -f-3 4-4 4-5 

1 ' i 1 1 I 

1 1 1 1 1 1 

1 1 1 1 1 1 

-4-1 

ii(-) 

i(+) 


-4-3 


Pole druhé a čtvrté má četnosti xy záporné, poněvadž jeden ze sou- 
činitelů je kladný a druhý záporný. Pole první a třetí má četnosti xy 
kladné, poněvadž oba součinitelé jsou kladní nebo oba záporní. 

Z (x y i) 

Potom je možno přikročiti k vypočítání hodnoty ^ 


podle jednotlivých polí. 

Uvádíme podrobně výpočet třetího (kladného) a druhého (záporné- 
ho) pole, výpočet prvního a čtvrtého pole pro jejich obsáhlost jen úhrnně. 

II. pole: 


III. pole: 

19.656 X 1 = 19.656 
11.054x 2 = 22.108 
10.367x 3 = 31.101 
37.226 x 2 = 74.452 
25.398 X 4 = 101.592 
15.788x 6 = 94.728 
23.575 X 3 = 70.725 
52.943 X 6 = 317.658 
50.444 X 9 =453.996 
úhrn = 1,186.016 


6.657 X 1 = 6.657 
4.434 X 2 = 8,868 
4,525 X 3 = 13.575 
4.905 X 2 = 9.810 
3.162 X 4 = 12.648 
3.336 X 6 = 20.016 
3.884 X 3 = 11.532 
2.567 X 6 = 15.402 
2.653 X 9 = 23.877 
6;010 X 4 = 24.040 
4.083 X 8 = 32.664 
4.404x12 = 52.848 


úhrn = 231,937 

úhrn čtvrtého pole činí 173.121, úhrn prvního pole Činí 1,825.237, 
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Summa I (xyj) = 


I. pole +1,825.237 
III. pole +1,186.016 


+3,011.253 
II, pole ^231.937 
IV. pole —173.121 
—405.058 
úhrn +2,606.195 


_ 2,606.195 


N 


- 3,912 


Sixyf) Kxvi) 

Skutečná hodnota se pak — - — 


.V 

= 3,912 + 0,565 = 4,477, 

, _ l'(xyf) 


666.226 

rovna = ■ 


N 


— C. - 


4,477 


= 0,801. 


N OxOj/ 5,585 
Směrodatná odchylka tohoto korelačního koeficientu se rovná 


1 — 

~iW~ “ 


1— 0,801 
1^ 666.226 


1—0,6410 

816 


= 0,00043. 


3 íJr = 0,00129 < 0,801, korelační koeficient lze tedy považovat! 
za spolehlivou míru korelace. 

Nelineární korelací nazýváme takový případ závislosti mezi znaky 
kvantitativními, při které vzájemné uspořádání souboru podle obou 
znaků v korelační tabulce nelze vyrovnati přímkou, nýbrž jinou čarou,, 
obyčejně křivkou. Nejjednodušší případ nelineární korelace je vyrovnání 
křivkou druhého stupně podle methody nejmenších čtverců. Ke zjištění 
nelineární korelace hodí se spíše výpočet korelačního poměru, míry to 
korelace, kterou srovnáváme s koeficientem korelace, abychom zjistili 
velikost odchylky dané korelace od korelace lineární. 


Vzorec korelačního poměru je rj — , kde znamená směro- 

datnou odchylku průměrů hodnot y v každé třídě znaku x od aritme- 
tického průměru všech hodnot znaku ?/, a Oy znaqí opět směrodatnou 
odchylku jednotlivých hodnot y od aritmetického průměru hodnot y. 
Je tedy třeba vypočítati nejprve pro každou hodnotu x (resp. pro každou 
třídu znaku x) průměr hodnoty znaku y na ni připadající, potom vy- 
počíst! rozdíl této hodnoty od aritmetického průměru znaku y (pro celý 
soubor). Tento rozdíl se pak umocní dvěma (a násobí četností příslušné 
třídy znaku), pak dělí počtem všech pozorování a odmocňuje dvěma, 
stejně jako při výpočtu směrodatné odchylky. 
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Příklad č. 30. Korelace mezi výškou tšla otců a synů. (Yule Úvod do theorie statistiky, č. překlad, str. 161.) 


Výška 

Výška těla otců v palcích 


těla 

68,6 

69,6 

60,6 

61,6 

62,6 

63,6 

64,6 

66,6 

66,6 

67,5 

68,6 

69,5 

70,6 

71,6 

72,5 

73,6 

74,6 

Úhrn 

synu 
















74,5 

75,6 


v palcí.h 

69,5 

60,6 

61,5 

62,6 

63,6 

64,6 

65,6 

66,5 

67,6 

68,6 

69,5 

70,6 

71,6 

72,5 

73,5 


69 , 6 - 60,6 




_ 

. 

0,5 

0,5 

1 











2 

60 , 6 - 61,6 

— 

— 

— 

... 

0,6 

— 

— 

- 

1 

— 

— 

— 

- 

— 

- 

- 


1,6 

61 , 6 - 62,6 

— 

0,25 

0,26 

- 

0,6 

1 

0,26 

0,26 

0,6 

0,6 

- 

- 

- 

— 

- 

- 

— 

3.5 

62 , 6 - 63,6 


0,25 

0,25 

2,26 

2,26 

2 

4 

6 

2,76 

1,25 

- 

0,25 

0,25 

- 

- 

- 

- 

20,5 

63 , 6 - 64,6 

1 

— 

1,5 

3,76 

3 

4,26 

8 

9,26 

3 

1,26 

1,6 

0,76 

1,26 

— 

- 

- 

- 

38,6 

64 , 6 - 65,5 

2 

1 

0.6 

2 

3,26 

9,6 

13,6 

10,76 

7,6 

6,6 

3,6 

2,6 

— 

— 

- 

- 

— 

61,5 

65 , 6 - 66,6 

_ 

0,6 

1 

2,26 

6,26 

9,6 

10 

16,76 

17,5 

16 

6,26 

2 

2,6 

1 

- 

- 

- 

89,5 

66 , 6 - 67,6 

_ 

1,6 

2 

4,76 

3,5 

13,76 

19,75 

26,6 

25,76 

19,6 

12,5 

13,76 

3,25 

0,5 

1 

- 

- 

148 

67 , 5 - 68.5 


— 

1,5 

2 

7,6 

10 

10,25 

24,25 

31,5 

23,6 

29,5 

13,26 

8,6 

9,5 

2,26 

- 

- 

173,5 

68 , 5 - 69,5 

- 

— 

1 

_ 

8,26 

6 

12,76 

18,26 

16 

24 

29 

21,5 

10 

3,5 

2,26 

- 

1 

149,6 

69 , 6 - 70,6 

_ 

— 

— 

- 

1 

2,6 

6,76 

18,76 

11,76 

19,6 

22,6 

19,6 

14,5 

6,26 

3,6 

1,6 

1 

128 

70 , 6 - 71,6 

_ 

— 

— 

_ 

_ 

3,26 

6 

8,76 

10,76 

19 

14,76 

20,75 

10,75 

8 

6 

1 

1 

108 

71 , 5 - 72,5 

— 

— 

— 

... 

— 

0,25 

3 

1,26 

7 

7,75 

10,75 

11,25 

10 

8,6 

2,76 

0,6 

— 

63 

72 , 6 - 73,6 

_ 

— 

— 

— 

— 

— 

0,76 

0,76 

2,6 

7,6 

6,6 

6 

7,6 

6,26 

3,26 

0,6 

0,5 

42 

73 , 5 - 74,6 

— 

— 

— 

- 

1 

— 

1,6 

1,6 

— 

6,26 

2,26 

2,6 

6,6 

3,26 

3,26 

— 

2 

29 

74 , 6 - 75,6 

— 

— 

— 

— 

— 

— 

— 

— 

— 

1 

2 

- 

2,6 

0,75 

1,76 

0,6 

- 

8,6 

76 , 6 - 76,5 










1,26 

0,26 

- 

0,6 

1 

1 

- 

- 

4 

76 , 6 - 77,6 

— 

— 

_ 

— 

— 

— 

— 

— 

— 

1,26 

0,26 

1 

— 

— 

1,6 

— 

— 

4 

77 , 6 - 78,6 











1 

1 

— 

0,26 

0,76 

- 

- 

3 

78 , 5 - 79,5 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

0,26 

0,26 

— 

— 

0,6 

Úhrn . . . 

3 

3.5 

8 

17 

33,6 

61,6 

95,6 

142 

137,6 

164 

141,5 

116 

78 

49 

28,5 

4 

6,6 

1078 


Vzhledem k tomu, že se korelační poměr zakládá na dvojmocích 
odchylek, je vždy číslem kladným, a dá se dále odvoditi, že nemůže býti 
menší než korelační koeficient r pro tytéž páry znaků x a y. 


Příklad č. 30. {Yule, Úvod do theorie statistiky, český překlad, 
str. 161.) 


Jednotlivé charakteristiky tohoto souboru jsou: 


Aritmetický průměr hodnot x Ax 

Aritmetický průměr hodnot y Ay 

Směrodatná odchylka pro x ox 

Směrodatná odchylka pro y Oy 

klíra korelace r 


67,70 palců 
68,66 ,, 
2,72 „ 

2,75 „ 

+0,51 „ 


Výpočet korelačního pomČru mezi výškou tČla synii a výškou tčla otců,. 
{Yule, 1. c. str. 209.) 


Střed tříd 
znaku x 
(výška těla 
otců) 

Aritmetic- 
ké průměry 
sloupců zna- 
ku y (výška 
těla synů) 

Rozdíl od 
aritm. přij- 
me ru výšky 
těla všech 

S^TU*! 

(Ai,= 68,66) 

Čtverec 

tohoto 

rozdílu 

Četnost 

jednotlivých 

sloupců 

Součin 
četnosti 
a dvojmo cí 
rozdílu 

69 

64,67 

-3,99 

16,9201 

3 

47,76 

60 

66,64 

-3,02 

9.1204 

3,6 

31,92 

61 

66,34 

-2,32 

5,3824 

8 

43,06 

62 

65,66 

-3,10 

9,6100 

17 

163,37 

63 

66,68 

-1,98 

3,9204 

33,6 

131,33 

64 

66,74 

-1,92 

3,6864 

61,6 

226,71 

66 

67,19 

-1,47 

2,1609 

96,5 

206,37 

66 

67,61 

-1,06 

1,1026 

142 

166,66 

67 

67,96 

-0,71 

0,6041 

137,6 

69,31 

68 

69,07 

+0,41 

0,1681 

164 

26,89 

69 

69,39 

+0,73 

0,6329 

141,6 

76,41 

70 

69,74 

+ 1,08 

1,1664 

116 

136,30 

71 

70,50 

+ 1.84 

3,3866 

78 

264,08 

72 

70,87 

+2,21 

4,8841 

49 

239,32 

73 

72,- 

+ 3.34 

11,1656 

28,6 

317,93 

74 

71,60 

+ 2,84 

8,0656 

4 

32,26 

76 

71,73 

+3,07 

9,4249 

6.6 

61,84 

Součet 




1.078 

2.218,42 


o2^j,= 2.21 8,42 : 1.078= 2,058, OAy = F 2,058 = 1,43,7? = —^'- 

Oy 

= 0,52. 


1.43 

2,75 
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Postup pro výpočet hodnoty znaku y pro každou třídu znaku x je 
patrný z výpočtu pro třídu první a druhou znaku x\ 

a; = 69 64 x 1 = 64 

65 X 2 130 

194 : 3 = 64,67 

z ^60 62 X 0,25 = 15,50 

63 X 0,26 = 16,75 

65 X 1 =65 

66 X 0,5 = 33 

67 X 1,5 = 100,50 

229,75 : 3,5 = 65,64 

t. j. střed každého intervalu třídního násobíme četností třídy znaku y, 
úhrn součinů pak dělíme počtem všech případů. 

Poněvadž je korelační poměr vždy číslem kladným, usuzujeme na 
kladnou nebo zápornou korelaci podle podoby korelační tabulky. 

Je-li korelační poměr značně vyšší než korelační koeficient, jde o ko- 
relaci nelineární. V daném příkladě rozdíl je malý 

Y! — r = 0,52 — 0,51 = 0,01, je tedy korelace lineární. 

3. Korelace dílčí. 

Jestliže máme dánu závislost mezi více než dvěma znaky kvanti- 
tativními, nebo domníváme-h se, že závislost mezi dvěma znaky kvanti- 
tativními je zprostředkována jejich závislostí na znaku třetím (nebo 
na více znacích jiných), mluvíme o mnohonásobné korelaci. Hledáme-li 
v souboru rozděleném na př. podle tří znaků korelaci mezi dvěma 
znaky pro určitou danou hodnotu znaku třetího, nazývá se tato korelace 
dílčí (parcielní), neboť je určena koeficientem dílčí korelace, označova- 
ným rj 2.3 v té části souboru, v níž má první znak jistou danou (kon- 
stantní) hodnotu, (srv. Janko Základy statistické indukce, str. 79, tam 
též další postup při výpočtu dílčích korelačních koeficientů). 

4. Korelace u řad časových. 

Poněvadž v řadách časových vznikají často klamné nebo jen zdán- 
livé korelace mezi kvantitativními znaky, používá se při výpočtu ko- 
relace methody zvláštní, že se nesrovnávají hodnoty obou znaků, nýbrž 
jejich změny v časových obdobích. Postupuje se tak, že se odečítá vždy 
hodnota následující od hodnoty předcházející a z těchto rozdílů se 
teprve počítá korelace stejnou methodou, jako u jiných souborů. Tím 
se snažíme odstraniti vliv náhodných stejně u obou znalců působících 
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příčin, které v časovém vývoji, a tedy i v časových řadách, často se 
vyskytují a vyvolávají zdánlivé korelace různého stupně. Někdy ani to 
se ještě nepovažuje za dostatečné, a počítají se druhé rozdíly t. j. rozdíly 
ze dvou sousedních rozdílů hodnot znaků. Podobně je možno postoupit! 
ještě k vyšším rozdílům, třetím nebo čtvrtým, a z nich teprve počítati 
korelační koeficient. 

Příklad ě. 31. Korelace mezi natalitou a úmrtnosti v Čechách v letech 
1893 az 1913. 


Kok 

Na ICOO 
obyvatel 
připadalo 

Rozdíly od 
aritmetického 
pr 11 mě ju 

Dvojmoci 

odchylek 

Součiny 

živé na- 
rozených 

zemře- 

lých 

/4a,=32-9 


a* 

3/" 

H- 

— xy 

1893 

36-9 

27.5 

+ 4-0 

+ 4-8 

16-00 

23-04 

19-20 


1894 

36-4 

26-6 

-f 3-5 

+ 3*8 

12-26 

14-44 

13-30 


1895 

37*1 

25-3 

+ 4*2 

+ 2*6 

17-64 

6-76 

10-92 


1896 

37*3 

24-4 

+ 4*4 

+ 1*7 

19-36 

2-89 

7-48 


1897 

36'8 

24-6 

+ 3*9 

+ 1-8 

15-21 

3-24 

7-02 


1898 

36*6 

24-2 

+ 3-7 

+ 1-5 

13-69 

2-26 

1-50 


1899 

36-7 

26'3 

+ 3*8 

+ 2-6 

14-44 

6-76 

9-88 


1900 

34-4 

24-2 

+ 1-6 

+ 1-5 

2-26 

2-25 

2-25 


1901 

34-1 

23-3 

+ 1-2 

+ 0-6 

1-44 

0-36 

0-72 


1902 

34-8 

23-4 

+ 1*9 

+ 0-7 

3-61 

0*49 

1-33 


1903 

33-0 

22-9 

+ 0*1 

+ 0*2 

0-01 

0-04 

0-02 


1904 

33-2 

22-7 

+ 0*3 

0 

0-09 

- 

- 


1905 

30-9 

23-8 

- 2*0 

+ M 

4-00 

1-21 


- 2-2 

1906 

32-6 

20-3 

- 0-4 

- 2-4 

0-16 

5-76 

0-96 


1907 

31-6 

20-9 

- 1*3 

- 1-8 

1-69 

3-24 

2-34 


1908 

31-8 

20-9 

- 1*1 

- 1-8 

1-21 

3-24 

1-98 


1909 

29-7 

20-6 

- 3-2 

- 2-1 

10-24 

4-41 

6*72 


1910 

28-6 

19-4 

- 4-4 

- 3-3 

19-36 

10-89 

14-62 


1911 

27 '€ 

19-9 

- 6*3 

- 2-8 

28-09 

7-84 

14-84 


1912 

26-3 

19*7 

- 6*6 

-30 

43-66 

9-00 

19-80 


1913 

25-8 

18-1 

-71 

- 4-6 

60-41 

21-16 

32-66 







274-71 

129*27 

167-44 

- 2-2 


Ax = 32,9, Ay 
2’(a;2)= 274,71 
Z(yf= 129,27 
2* (a;i/) = 165,24 


= 22,7 


^ v) 

I' 2 (xY 2 (2/)^ 


= 0,876 
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Střední theoretická odchylka tohoto korelačního koeficientu 


— r3 _ ] >-* 0,767 


Trojnásobná střední odchylka 3(7^=0,153, korelační koeficient pře- 
vyšuje tedy značně trojnásobek střední odchylky. 

Počítáme-li však korelaci nikoli přímo z hodnot (poměrných čet- 
ností) natality z úmrtnosti, nýbrž z rozdílů prvního stupně z obou řad, 
obdržíme tabulku: 


Pokračování príkl, č. 31. Korelace mezi natáliiou a úmrtnosti v Čechách, 


Rozdíly první- 
ho stupně 

Odcíiylky roz- 
dílů od aritin. 
průměRi 

Dvojmoci odchylek 

Součiny 

v řadě 
natality 

v řadč 
úmrt- 
no ti 

^,=01 



2/‘ 

+ xy 

^ xy 

+ 0,5 

+ 1,0 

-0,1 

+ 0,5 

0,01 

0,25 


-0,05- 

-0,7 

+ 1,2 

-1,3 

+ 0.7 

1,69 

0,49 


-0,91 

-0.2 

+0,9 

-0,8 

+ 0,4 

0.64 

0,16 

+ 0,32 


+0.5 

-0,1 

-0,1 

-0,6 

0,01 

0,36 

+0,06 


+0,2 

+0,3 

-0,4 

-0.2 

0,16 

0,04 

+ 0,08 


-0,1 

-1.1 

-0,7 

-1.6 

0,49 

2,56 

+ 1,12 


+2,3 

+ 1,1 

+ 1.7 

+ 0,6 

2,89 

0,36 

+ 1.02 


+ 0,3 

+0,9 

-0,3 

+ 0,4 

0,09 

0,16 


-0,12 

-0,7 

-0,1 

-1,3 

-0.6 

1,69 

0,36 

+0,78 


+ 1,8 

+0,5 

+ 1,2 

0 

1,44 

0 

- 

- 

-0,2 

+ 0,2 

-0,8 

-0,3 

0,64 

0,09 

+0,24 


+ 2,3 

-1,1 

+ 1,7 

-1.6 

2.89 

2,56 


-2,72 

-1,6 

+3,5 

-2,2 

+ 3,0 

4,84 

9,00 


-6,60 

+0,9 

-0.6 

+0,3 

-1,1 

0,09 

1,21 


-0,33 

-0,2 

— 

-0.8 

-0,5 

0,64 

0,25 

+ 0.40 


+ 2.1 

+ 0,3 

+ 1.5 

-0.2 

2,25 

0,04 


-0,30 

+ 1,2 

+ 1.2 

+0,6 

+0,7 

0,36 

0,49 

+0,42 


+0,9 

-0,6 

+0,3 

-1,0 

0,09 

1,00 


-0,30 

+ 1,3 

+0,2 

+0.7 

-0,3 

0,49 

0,09 


-0,21 

+0,5 

+ 1,6 

-0,1 

+ 1,1 

0,01 

1,21 


-0.11 





= 21,41 

= 20,68 

Z\,xy = 
-4,44 

= - 11,65 


Ax = -[■ 0,6, Ay ^ + 0,5 
Z (xf - 21,41 
2* (yf = 20,68 
{xy)^ — l,2l 

r 

1/ Z{xY y{yf 


0,342 


7 Rukojeť Ktetlstlky 
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Prostým srovnáním řad natality a úmrtnosti za dvacet jeden rok 
v Čechách pozorujeme velkou souběžnost obou řad, které obě vykazují 
výraznou sestupnou tendenci. Také korelační koeficient, ke kterému 
jsme dospěli, je velmi vysoký a positivní. 

V3rpočteme-li však rozdíly prvního stupně v obou řadách a z nich 
korelační koeficient, jak se stalo v pokračování příldadu č. 31, obdržíme 
koeficient korelace nízký a k tomu negativní. Je patrné, že závislost 
mezi oběma soubory je spíše vyvolána společnými vzdálenými příčinami 
(mluvívá se o sekulárních vývojových tendencích), než jejich bez- 
prostřední spojitostí. Korelaci v řadách časových je potřebí posuzovati 
zvláště opatrně. 

Tjítcratiira ke kapitole 10—11. Nej významnější spisy citovány jsou v textu. 
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Kapitola 12. 


NÁHODNÉ VÝBĚRY. 


Již v kapitole 4, odd. II. jsme srovnávali všeobecné theoretické 
rozložení souboru s jeho rozložením skutečným (empirickým), na př. 
výsledky vrhů mincí s theoretickou (mathematickou) jejich pravdě- 
podobností. Nyní jde o speciálnější případ a problém, totiž srovnávali 
theoretické rozložení četností, vypočítané podle předpokládané hypo- 
thésy se skutečným rozložením četností pozorovaného souboru. Pozo- 
rovaný soubor považujeme při tom za výběr, vybraný vzorek, z theore- 
tického souboru. 

Problém záleží prakticky v tom, že při statistických šetřeních velmi 
často není možno zachytiti vyčerpávajícím způsobem celý soubor, nýbrž 
že se musíme spokojiti pouze se šetřením, kterým zachycujeme toliko 
výběr z celkového souboru. Je ovšem otázka, múžeme-li považovat! 
výsledky statistického popisu získané na tomto výběru nebo vzorku za 
platné též pro celý soubor, tedy na př. můžeme -li považovat! aritme- 
tický průměr získaný z pozorovaného výběru za charakteristický též 
pro celý soubor. 

Janko (Základy statistické indukce, str. 95) nazývá zobecnění sta- 
tistických výsledků, získaných zpracováním určitého souboru, za před- 
pokladu, že je možno vztahovat! hodnoty zjištěných charakteristik na 
rozsáhlejší soubor než je ten, ze kterého byly skutečně odvozeny, sta- 
lištičkou indukci. 

Zkoumat!, zda můžeme považovat! výsledky na vybraném vzorku 
za platné pro celý soubor, umožňuje t. zv. test Pearsonicv, označovaný 
řeckým písmenem chí Test tento se zakládá na srovnání hodnot theo- 
retických a skutečných v pozorovaném výběru a rovná se součtu dvoj- 
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mocí těchto rozdílů uvedených v poměr k theoretické četnosti výběru 



rované), v r-tém výběru, m hodnoty theoretické v témže výběru, nir 
thbcretickou četnost v témž výběru. 

Z tohoto vzorce je patrno, že rozdíly mezi hodnotami theoretickými 
a empirickými jsou ve čtverci a tedy vždy kladné, a že čím jsou jednotlivé 
ty rozdíly větší, tím je větší i celkový součet a tudíž i X’^. V případě, 
že by obě rozložení, theoretické i skutečné, byla shodná, součet rozdílů 
a tedy i by se rovnalo nule. 

Theoretickou pravděpodobnost a theoretické rozložení souborů 
vznilílých z vrhu mincí a jiných her náhodných, kde podmínky očekávané 
události jsou známé, lze vypočítat! podle počtu pravděpodobnosti a 
srovná váti pak s výsledky pozorovaných událostí (na př. ve výběru 1000 
hodů mincí). U skutečných, empirických souborů statistických ovšem 
neznáme předem theoretické rozložení. Přes to můžeme použiti i u těchto 
souborů uvedeného postupu a Pearsonova te^tu za určitých podmínek. 

Máme-li nějakou hypothesu, která nám dává souhrnně toliko čtyři 
možné výsledky, pouze tři z nich jsou neodvislé, čtvrtý je dán jako 
nutný výsledek prvních tří. Mluvíme pak o třech stupních volnosti, 
o jednom méně než je počet všech případů možných. 

Takové případy vyskytly se nám v kapitole o závislosti znaků kva- 
litativních. Zkoumali jsme na příklad závislost mezi pohlavím mužským 
a úmrtností v souboru obyvatelstva Čech (př. c. 24). 

Předpokládejme nyní, že mezi úmrtností a pohlavím není žádné zá- 
vislosti, nýbrž že znaky ty jsou nezávislé. Potom platí známá rovnice 


(v. kap. 10). (AB) = 


Z této rovnice, která by musila platiti, kdyby oba znaky A i B byly 
na sobě nezávislé, jak předpokládáme, můžeme si postupně vypočítat! 
všechny hodnoty theoretické, pro (AB), (A^), (uB), (a^), které potřebu- 
jeme. Výsledek je patrný z tabulky dále uvedené, kde nejprve jsou vždy 
uvedeny hodnoty skutečné, pod nimi hodnoty theoretické. 

Příklad č. 32. Postup je takový: 



3,452.123 X 1)5.597 
7,109,376 


46.419,3. 
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Dále dosazujeme: 

(A§) = [A) — (AB) = 3,405.703,7 


(aB) ={B) 
(a^) = (a) 
(AB) 

(zemřelí muži) 
skutečné 49.398 
theoretické 46.419,3 


(AB) = 49.177,7 
• (ojB) = 3,608.075,3 

[Ap) 

(muži, kteří nezemřeli) 
3,402.725 
3,405.703,7 


(A) 

(celý soubor mužů) 
3,452.123 


(zemřelé ženy) (ženy, které nezemřely) 

skutečné 46.199 3,611.054 

theoretické 49.177,7 3,608.075,3 

(B) . . , 

(všech zemřelých) (všichni obyvatelé, kteří 

nezemřeh) 

95.597 7,013.779 


{a) 

(celý soubor žen) 
3,657.253 


N 

(celý soubor obyvatel- 
stva) 
7,109.376 


Z této tabulky zjistíme rozdíly mezi hodnotami skutečnými a theo- 
retickými a vypočteme 

— m, = 49.398 — 46.419,3 = 2.978,7 
mg — mg = 3,402.725 ~ 3,405.703,7 = - 2.978,7 
m, — mg = 46.199 — 49.177,7 = — 2.978,7 
= 3,611.054 — 3,608.075 = 2.978,7 


Potom se rovná = 


2.978,7 2.978,7 2,978,7 

46.419,3 3,405,703,7 49.177,7 


2.978,7 

3,608.075 


376,6 


-f 


Pro různé hodnoty integrálu funkce X” sestavil Pearson a později 
Fisher tabulku, ve které je možno nalézti jim odpovídající hodnoty 
pravděpodobnosti P. Za statisticky významné je zvykem považovati 
pouze hodnoty větší, než pro jaké je pravděpodobnost 0,05. 

Tabulky tyto jsou otištěny v celém rozsahu v Pearsonových Tables 
for Statisticiana and Biometricians, Londýn 1914 a 1931. 

V příkladě č. 32 je hodnota velmi vysoká, což předem ukazuje, že 
je velký stupeň associace obou znaků, a že P, pravděpodobnost jejich ne- 
odvislosti, je velmi malá. Tak vysoké hodnoty X^ nejsou již obsaženy 
v uvedených Pearsonových tabulkách a je třeba k výpočtu příslušné 
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hodnoty P použiti methody uvedené v tabulce XVII a v úvodu k Pear- 
sonovým tabulkám na str. XIII a XXXV. 


Fozuámka. Postup je následující: 

V' tabulce XVII na jdeme hodnoty nej bližší * 376,6 

pro 350 74.826 diference 1. řádu diference 2. řádu 

pro 400 86,655 10,829 0,003 

pro 450 96,487 10,832 

(-logP) = 74,826 + {10.829) — y(-^] (0,003) = 80,687 

logP = 81,413 
I 589 

P «■ — *^^dy hodnota krajně nepatrná vzhledem k velikosti 
jmenovatele. 


Na srovnání rozložení theoretického s rozložením skutečným uvnitř 
vybraného vzorku zakládá se rovněž kriterium zvané divergenč- 

ním koeficientem a označované písmenem Q. Kriterium to srovnává 
theoretickou odchylku se směrodatnou odchylkou pozorovaného souboru: 


Q = 


2 : w 

í r — I 


pq 


při Čemž v čitateli písmenem r označujeme počet případů ve vybraném 
vzorku, písmenem s ve jmenovateli průměr počtu všech případů. 

Ve většině případů souborů jevu sociálních bychom nemohli použiti 
tohoto vzorce, poněvadž neznáme theoretické pravděpodobnosti výskytu 
těchto jevů. V řadách časových můžeme však nahraditi pravděpodobnost 
theoretickou pravděpodobností empirickou t. j. béřeme za theoretické 
takové poměrné četnosti, jaké jsme při pozorování velkého počtu případů 
zjistili. Na př. nevíme, jaká by měla býti theoretická pravděpodobnost 
výskytu mužského pohlaví u novorozených dětí, zda poměr 1:1 nebo 1 :2 
nebo nějaký jiný. Na základě pozorování velkého počtu novorozenců 
během dlouhé doby zjišťujeme průměrný poměr 51:100 novorozených 
pohlaví mužského ke všem novorozeným. Poměrnou četností pohlaví 
mužského mezi novorozenými tedy nahrazujeme theoretickou pravdě- 
podobnost p, kterou neznáme. 

OznaČíme-h tuto empirickou pravděpodobnost poměrnou četností 

7H 

— a nahradíme jí theoretickou pravděpodobnost p a podobně též pravde- 
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podobnost q, která, jak víme, se rovná q — l — 35, nahradíme poměrem 
1 — — , obdržíme divergenční koeficient v podobě 



Podle toho, je-li theoretická odchylka (takto suponovaná) větší nebo 
menší než skutečná směrodatná odchyllía, a divergenční koeficient je 
tudíž menší nebo větší než jedna celá, mluví se o nadnormální nebo 
subnormální dispersi. Ve statistických souborech z oboru jevů sociálních 
je pravidlem nadnormální disperse. 

Lexisův divergenční koeficient lze snadno převésti na Pearsonův 

test .X“, ne bot Q = — p, kde r značí počet prvků, z nichž se výběr 

skládá. 

Příklad č. 33. 

Podíl mrtvě narozených dětí na všech porodech v Československu v letech 

1925 — 1935 . 


(Pramen: Statistická příručka BČS. XV, Statistická ročenka 1934, 1935, 1936, 1937, 

1938.) 


Kok 

všech 

rozených 

mrtvě 

rozených 

ze všech roze- 
ných bylo 
mrtvě roze- 
ných 

odchylky 
od průměru 

X 

dvojmoci 

odchylek 

a:* 

1925 

364.326 

8.337 

0,0229 

0,0005 

0,00000025 

1926 

369.966 

8.249 

0.0229 

0,0006 

0,00000025 

1927 

343.372 

7.663 

0,0223 

- 0,0001 

0,00000001 

1928 

344.794 

7.626 

0,0218 

- 0,0006 

0,00000036 

1929 

333.689 

7.282 

0,0218 

- 0,0006 

0,00000036 

1930 

340.704 

7.461 

0,0219 

- 0,0006 

0,00000026 

1931 

325.430 

7.167 

0,0215 

- 0,0009 

0,00000081 

1932 

319.761 

7.304 

0,0220 

- 0,0004 

0,00000016 

1933 

294.473 

6.766 

0,0224 

0 

0 

1934 

287.227 

6.470 

0,0225 

0,0001 

0,00000001 

1935 

277.008 

6.083 

0,0220 

- 0,0004 

0,00000016 

Úhrn 

3,690.639 

80.286 



0,00000262 
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Průměr za jedenáct let: 

326.422 


7209 


(zaokrouhleno 
0,02236 na 0,0224) 


Q ^ 


]/ P(1 


n 


V 0.000000262 _ 0,00051186 

|f'Ó^224 x" 0,9776 " 0,00025884 
» 326.422 


1.977, 


Poněvadž Pearsonův test se rovná =Q(r — I) = 19.77, kde 
r — 1 =10 stupňů volnosti. 

Tomu odpovídá v tabulkách hodnot plocha mezi 0,05 a 0,02. Jako 
tedy divergenční koeficient Lexisův je dosti značně vyšší jedničky, i test 
Pearsonův ukazuje, že pravděpodobnost stálého poměru mezi živě a 
mrtvě rozenými dětmi je příliš malá, takže musíme považovati poměr 
tento ve vybraném časovém vzorku za náhodný. 

K Pearsonovu indexu významnosti můžeme však dospěti též přímo 
tak, že si sestrojíme theoretické rozložení souboru (základní soubor) a 
zjišťujeme odchylky od rozložení pozorovaného (vybraného vzorku). 
Chybící hypothésu o rozložení základního souboru nahrazujeme opět 
poměrem zjištěným za delší časové období, tedy v našem případě pomě- 
rem mrtvě narozených dětí ke všem narozeným v průměru uvedených 
jedenácti let. 


Příklad ě. 34. 

Poměr narozených nemanželských děti ke věem narozeným dětem. Je stálý 

nebo náhodný? 

V průměru patnáctiletí 1921 — 1935 byl poměr dětí nemanželských 
ze všech (živě i mrtvě) rozených dětí roven m = 0,106. V některých 
letech lze nalézti velkou shodu mezi předpokládaným theoretickýra roz- 
ložením a skutečným rozložením manželských a nemanželských porodů. 


R. 1929. 


Počet dětí 
manželských 


hodnoty skutečné (m) . . .298.016 
hodnoty očekávané (m) . . .298.239 


(m — mY 

tn 


0,167 


počet dětí 
nemanželských 
35.573 
35.350 

1,407 


Úhrn 

333.589 

333.589 

1,574 


Hodnotě = 1,574 odpovídá v Pearsonově tabulce pro jeden 
stupeň volnosti, t — 1 =1, plocha mezi 0,20 a 0,30. Vybraný vzorek za 


104 


r. 1929 tedy plné potvrzuje hypotésu očekávaného poměru nemanželských 
dětí (nebylo by tomu asi tak u některých jiných roků.) 

Uvedené methody, podobně jako Lexisova divergenčního koeficientu, 
můžeme použiti ])ouze u řad časových. Věcné řady statistické, upravené 
podle znaku kvantitativního, lze však srovnávat! s teoretickým rozlo- 
žením podle Laplacfí-ova {Gatcssova) zákona, a to opět v některých pří- 
padech i v oboru jevů sociáhiích, na př. demografických, a to použitím 
methody Shepjxírdovy a jeho tabulek Laplace-ova integrálu, obsažených 
v Pearsonových Tables for Statistícians and Biometricians. 

Velká stabilita blížící se normální, jDodle Lexisova kriteria, vyskytuje 
se často též u souborů jevů, které jsou velmi řídké, tedy jejichž pravdě- 
podobnost ve velkém souboru je velmi nepatrná, jako jsou na př. sebe- 
vraždy dětí, vzácně se vyskytující nemoci a pod. Tuto pravidelnost 
v Časových řadách u jevů zřídka pozorovaných a majících tedy jen 
malou pravděpodobnost, pravidelnost, která na první pohled překvapuje, 
nazval Bortkiewicz (Bortkiewicz Das Gesetz der Ideinen Zahlen, Lipsko 
1898) zákonem malých čísel. 

Normální nebo skoro normální stabilita některých jevů, které podle 
obecného přesvědčení a subjektivního cítění lidského jsou závislé na jeho 
svobodném rozhodování, vedla některé statistiky k tomu, že se snažili ob- 
jasnit! statistickou methodou problém svobodné vůle a vytvořih tak za- 
jímavou kapitolu historie novodobé statistiky. 

Byl to zejména Qv^telet a jeho žáci, kteří se snažili ve společenských 
jevech nalézti pevné zákony jako obdobu zákonů přírodních a kteří po- 
važovali též stabilitu časových řad, vyjadřujících jevy sociální, za výsle- 
dek působení pevných sil a tudíž za odporující učení o svobodě lidské 
vůle. Největším dojmem působily časové řady t. z v. morální statistiky, 
na př. počet sebevražd, zločinů, kde událost sama je výsledkem rozho- 
dováni a lidské úvahy. Stabilitu těchto řad vykládal Quételet a jeho škola 
tím, že existují jisté stálé příčiny, které nutně vedou k takovým Činům, 
působíce neodolatelnou silou na určitá individua. Toto mechanistické 
pojetí takových činů, které je vykládalo obdobným způ.sobem, jako po- 
hyby fysických těles nebo strojů působením fysických sil, vedlo u ně- 
kterých statistiků k závěru o úplném determinismu všeho lidského konání 
a k popření svobodné lidské vůle vůbec. Quételet sám se domníval, že 
společnost lidská má v sobě zárodky všech zločinů, které mají býti spá- 
chány, že tyto zločiny připravuje a že zločinec je pouhým nástrojem, který 
je provádí, a že počet sebevr^ažd, vražd a zločinů je každého roku tak 
pevně předem stanoven, jalvo rozpočet státních příjmů a vydání. Od 
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tohoto společenského determinismu vedl pak vývoj ke společenskému 
fatalismu, jaký se projevuje na př. u Adolfa Wagnera, Comtea, Bucklm}) 
V beletrii se projevuje zejména ve směru zvaném naturalismus v druhé 
polovině 19. stol. (zvláště ve Francii Emile Zola ve svém románovém 
cyklu o rodině za druhého císařství, Rougon-Macquartech). Od spole- 
čenského fataUsmu vede pak další vývoj k fatalismu individuálnímu. 

Když byla statistická šetření z oborů morální statistiky konána po 
delší dobu a když tento statistický materiál byl podroben zvláště Lexisem 
a Bortkiewiczem novým rozborům, došlo se k poznání, že pravidelnosti 
v časových řadách nejsou tak stálé, jak se z počátloi jevily, nýbrž že i ča- 
sové řady z oboru jevů morálních vykazují růmé pohyby a tendence jako 
jiné řady časové. Zjistilo se, že změny v hospodářských a sociálních po- 
měrech mají vzápětí též změny v různých souborech t. z v. morální sta- 
tistiky. Z toho bylo patrno, že nelze považovati pravidelnosti v souborech 
těchto jevů za neměnné, pevně do budoucnosti určené. Těmito novými 
poznatky není ovšem vyřešena základní sporná otázka, problém svobody 
vůle, neboť je možný též výklad mechanistický, že změny sociálních 
podmínek (na př. zvýšení životní úrovně dělnictva, zlepšení všeobecného 
vzdělání, rozšíření sociální péče, což jsou skutečnosti, které lze většinou 
sledovat! též statisticky, nebo naopak zhoršení hospodářských poměrů 
v době hospodářských Icrisí) působí ve svém důsledku ony změny v po- 
měrných četnostech jevů z oboru morální statistiky, které konstatujeme. 

Pro problém individuální svobody lidské vůle (konkretisovaný na př. 
v otázku po odpovědnosti v trestním právu) nemůže statistická methoda 
poskytnout! ani kladného ani záporného argumentu, neboť problém ten 
je povahy filosofické. 

Literatura ke kapitolo 12. Vedle spisů v textu citovaných Janko ^ Základy 
theorie statistické indukce. 


Quéielet Sur rhomnoe et le développement de ses faciiltós, ou essai de phy- 
siquo sociále, Paříž 1835, Adolf Wagncr Die GosetzTuassigkeít in don scheiiibar 
willkůrlichen menschlichen Handlungen, HainLujg 1864. BucJde The histoiy of 
Civilizaticn in England, Londýn 1858, sr. v české literatuře Weyr Problém svobody 
vůle a statistika, Sborník véd právních a státních, XI. 
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Kapitola 13. 


GRAFICKÉ ZNÁZORNĚNÍ. 


Statistické údaje, výsledky statistických pozorování, které podle 
své povahy jsou vyjádřeny v číslech, je možno, jako jiné číselné hodnoty, 
znázorniti též graficky t. j. pomocí geometrických obrazců, případně též 
pomocí jiných grafických pomůcek, jako map a kreseb. 

Grafickým znázorněním lze dosáhnout! především větší názornosti 
a přehlednosti. Přímky a křivky nebo jiné geometrické obrazce před- 
stavující rozložení souboru nebo časovou řadu jsou daleko názornější 
a jasnější než číselné údaje představující tytéž statistické soubory. Proto 
se používá grafického znázornění zejména tam, kde jde o populariaační 
účely statistické. Nevýhodou grafického znázornění je, že volba měřítka 
je ponechána na vůli statistilíovi, a že tímto způsobem lze ovlivňovat! 
dojem, kterým na pozorovatele působí. 

Grafické znázornění má však ještě jiný význam, umožňuje totiž 
některé hodnoty nalézti geometrickou cestou snáze a jednodušším způ- 
sobem než výpočtem, na pr. vyrovnávati křivky rozložení četností, inter- 
polovati statistické hodnoty v řadách časových, jakož i kontrolovat! 
správnost výpočtů různých hodnot statistických. 

Hlavní druhy grafického znázorňování jsou: 

1. Diagramy. Statistické soubory se vyjadřují pomocí různých obraz- 
ců geometrických, bodů, přímek, křivek, čtverců, obdélníků, kružnic atd. 
Používá-li se obrazců prostorových (stereometrických) , mluví se též 
o stereogramech. Nejčastěji jsou používány diagramy přímkové a křivko- 
vé, při kterých hodnoty statistické se nanášejí na dvě osy k sobě kolmé 
(v praxi se užívá obyčejně čtverečkovaného milimetrového papíru). 
Znázorňujeme-li graficky rozložení četností, nanášíme na osu horizontální 
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Příklad 6. 36. Diagram [historiogram.) 
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(osu x) jednotky znaku (ev. třídy znaku), na pořadnice ^ (kolmice v těchto 
bodech vztyčené) příslušné četnosti znaku (tříd znaku). Spojením takto 
určených bodů přímkami nebo křivkami dostaneme diagram rozložení 
četností souboru (bývá nazýván též histogram). Podobně znázorňujeme 
řady časové nanášením časových jednotek na osu vodorovnou a přísluš- 
ných hodnot na pořadnice (bývá nazýván též historiogram). 


Příklad Č. 36, Diagram sloupkový. 


Počet a výiDora čcskýeli zemědělských závodu podle velikostních skupin 
v pohraničí r. 1989 

Počet závodů VýraSra zemčď. půdy 



m 




8Ú8 







1 




1 





2-5 -20 -50 -lOOpřeslOO 2-5 -20 -50 -100 pře^IOOha 
Volikostní skupiny podle zemčdčl ké půdy. 

= zemčdčl.ské závody z pozemkové rcrormy 

( P. amen Statistický zpravodaj roč. IX.) 


Nespoj ujeme-li body takto získané na dvou osách kolmých čarami, 
nýbrž sestroj íme-H obdélníky spojením bodů, jež jsou vrcholy kolmic 
vztyčených ve středu příslušných intervalů, obdržíme t. zv. polygony 
četností. 

Diagramy logaritmické jsou diagramy, sestrojené opět na dvou 
osách kolmých, na které se však nenanásejí hodnoty samé, nýbrž loga- 
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ritmy těchto hodnot. Logaritmický diagram podává jiný obraz statis- 
tické řady než diagram obyčejný a y5?jadřuje poměr hodnot k sobě na- 
vzájem, zachycuje tedy vztahy hodnot, nevyjadřuje hodnoty samé. 
Diagramy logaritmické se hodí zvláště k znázornění řetězových indexních 
čísel. 

Několika diagramy sestrojenými v^e stejném měřítku na stejné síti 
lze sledovati i závislost mezi soubory a znaky. Nelze-Ii z technických 
důvodů použiti měřítka stejného, užívá se též stupnice dvojí, odchylné 
na levé a pravé straně diagramu. 

Diagram sloupkový je sestrojen na stejném základě jako polygon 
četností, polygony se rozšiřují, aby bylo dosaženo větší názornosti, ve 
sloupky označené různými barvami nebo různě čárkované. Velikost 
hodnot je však vyjádřena toliko výškou sloupců. 

Diagram osový nebo paprskový je diagram, kde hodnoty se vyzna- 
čují paprskovitě z jednoho bodu (středu kružnice), místo na dvě osy 
kolmé. Hodí se jen pro krátké statistické řady, na př. pro znázornění 
časové řady během dvanácti měsíců, hodnoty pro jednotlivé měsíce se 
nanášejí ze středu na dvanáct os. 

Diagramy plošné (planimetrické) používají k znázornění statistic- 
kých údajů obrazců plošných, nej častěji čtverců nebo kružnic. Plošných 
diagramů používá se zejména tehdy, je-li třeba znázorniti hodnoty velmi 
veliké nebo navzájem velmi se lišící, takže bylo by obtížné vyjádřiti je 
měřítkem o jedné dimensi. Plochy (čtverce, výseče kruhové) musí ovšem 
vyjadřovati přesně údaje a jejich poměr. 

Diagramy prostorové (stereometrické) jsou znázorňovány obrazy 
prostorovými, krychlemi, koulemi, jehlany nebo válci. Jako obrazce 
o třech rozměrech mají výhodu, že se jimi mohou současně vyjádřiti tři 
rozměry, na př. korelační plocha v případě dílčí korelace mezi třemi 
znaky. Srovnání se zakládá na srovnání obsahů těles, sestrojování je 
dosti obtížné. Používá se jich též k účelům výstavním. 

Podřadným druhem diagramů jsou diagramy obrázkové (pikto- 
gramy), kde se používá nikoli geometrických obrazci\, nýbrž obrázků 
kreslených, na př. sudů, pytlů, figur lidských a pod. k vyjádření hodnot. 
Tyto diagramy slouží většinou pouze k účelům popu larisa čním a nebývají 
přesné. 

2. Kartogramy (nazývané též statistické mapy) jsou zeměpisné mapy, 
na kterých se vyznačuje místní rozložení statistických hodnot pomocí 
různých barev nebo stínování. Takto je možno vyjádřiti různé stupně 
znaků kvantitativních nebo též různé obměny nebo různé stupně po- 


110 




EIIL]-ío \7Zlsi-no ^^ist-soo ^^sa-zooo ^^m-sooo 88888 

Oblastní jednotkou znárodnění jsou soudní okresy — Stav z poěátku září 1945. (Pramen Statistický zpravodaj roó.lX.) 


Příklad č. 37. Kartogram, 





měrných četností znaků kvalitativních. V praxi je však nutno oineziti 
se na malý počet tříd nebo stupňů, jinak by se stal kartogram nepře- 
hledným. Stupnice se vyjadřuje pomocí různých barev, nebo různou 
intensitou téže barvy nebo různým stupněm stíňování. 

Kombinací zeměpisné mapy s diagramem vzniká t. zv. kartodiagram, 
v němž diagramy t. j. grafické znázornění statistických hodnot pomocí 
geometrických obrazců se lokalisují na mapě zeměpisné podle geogra- 
fického rozložení hodnot. 

Literatura ke kapitole 13, Koller, Graphijsche Tafein zuř Beurteilung statisti- 
scher Zahlon, Drážďany, 2. vyd. 1943. 


112 


Kapitola 14. 


POMOCNÉ METHODY STATISTICKÉ. 


Ve statistické praxi se často stává, že není. možno zachytí ti a statis- 
tickému setření podi-obiti celý soubor, tedy veškeré jednotky, z nicliž 
se theoreticky soubor skládá. To se stává pro obtíže bud rázu technického 
nebo finančního. Není na př. možno zachytiti statisticky ceny všech ob- 
chodovaných statků při sestrojování cenových indexních čísel nebo celý 
soubor průmyslových výrobků při aplikaci statistické methody na zkou- 
mání jejich jakosti. 

V takových případech se používá ve statistické praxi method, které 
lze souhrnně označiti jako pomocné nebo náhradní methody statistické. 
Tyto methody jsou vesměs charakterisovány tím, že nezachycují celý 
soubor. Nejdůležitěj.ší tyto methody jsou: 


Csis tečné šetření methodoii náhodného výběru. 

Theoretickó problémy částečného setření methodou náhodného vý- 
běru byly naznačeny v kapitole 12. Ve statistické praxi je pak důležité, 
aby se výběr skutečně zakládal na náhodě, byl mechanický bez jakéhokoli 
subjektivního vlivu, abychom se vyvarovali systematických odchylek 
v tom nebo onom směru, Na př. koná-li se statistické šetření o souboru 
rodin, jejich počtu dětí, jejich spotřebě, vyberou se k šetření pouze rodiny, 
jejichž jména počínají určitým písmenem v abecedě, třeba A, H, P. 
Takový náhodný soubor je možno uspořádati též ze souborů, skládajících 
se z jevů okamžitých (událostí) tak, že se opět náhodně zvolí některé 
časové období k šetření, na př. určité dny (pátého, desátého, patnáctého) 
,se vyberou k šetření frekvence na pouličních drahách. 


i Rnkověť statistiky 
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Předpokladem pro správný úsudek, který se zakládá na úvaze pars 
pro toto, je stejnorodoat souboru a dále výběr dosti veliký, aby se i ve 
vybraném vzorku mohl uplatnili zákon velkých čísel. 

Pozilámlía. Určení rozsahu výběru při znaku kvalitativním a kvuiititativníni 
v. Janko Jak vytváří statistika obrazy světa II, str. 76 sl. 

Z částečného souboru se usuzuje na celý soubor, jestliže naopak se 
z celého souboru usuzuje na jeho část, na př- z celoročního průměru cen 
zemáků se Činí úsudek na průměrné lednové ceny zemáku, jak uvádí 
Wagemanny jde spíše o zvláštní případ odhadu. Zvláštní terminologie 
Wagemannem navržená pro tyto logické úsudky (jako substituce, inkl use 
a pod.) nenabyla rozšíření. 

Částečné Šetření mcthodoii vyberu typických případů. 

Částečné Šetření statistického souboru lze provésti též tím způsobem, 
že se záměrně vyberou případy charakteristické, typické pro celý soubor 
a na tomto výběru se vykoná statistické šetření. Výsledky takto získané 
.šetřením výběru typických případů se pak považují za representační pro 
celý soubor. Odtud se nazývá tato methoda částečného šetření též metho- 
dou representační. Kdežto při methodě náhodného výběru rozhodovalo 
hledisko objektivní, mechanické, při této methodě rozhoduje hledisko 
subjektivní, záměrně se vybírá to, co se považuje za typické pro soubor. 
Avšak právě výběr případů skutečně typických, charaliteristických pro 
soubor, působí v praxi velké obtíže a nezdaří-li se, není výsledek šetření 
směrodatný pro celek. Nej Častějším případem použití této met hody je 
statistika domácícii učtu či budgetu. 

Odhad. 

Odhadu, t. j. přibližného ohodnocem', používá se dosti často ve sta- 
tistice jevů společenských, když soubor se vymyká přesnému pozorování 
a sčítání. Při tom může být i odhad přibližným oceněním souboru, učině- 
ným na základě věcné znalosti souboru, na př. odhad národního důchodu, 
který se opírá o určité částečné (i číselně vyjádřené) znalosti věcné, na př. 
statistické údaje o zdaněných důchodech, nebo odhad počtu obyvatelstva 
tam, kde není konáno sčítání lidu, na podkladě znalosti počtu obyvatel 
velkých měst a některých krajin, nebo odhad jednoho souboru na základě 
znalosti druhého, který máme statisticky vyšetřen. 

Druhým případem odhadu je ten, který se zakládá na odhadech 
průměrů, které se pak kombinují se skutečnými statistickými údaji. Jako 
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nejčastější příklad tohoto druhu odhadu lze uvésti t. zv. statistiku sklizní; 
ta se zakládá na odhadech průměrných hektarových výnosů sklizňových, 
které podávají zpravodajové (jmenovaní znalci) v každé obci; tyto odhad- 
nuté výnosy se pak násobí zjištěnými plochami osetými příslušnou plo- 
dinou v každé obci. Výsledky této methody se pak obvykle označují 
jako statistika sklizně, ačkoli nejde o přímé statistické zachyceni celého 
souboru, které jest z technických důvodů nemožné, nýbrž o uvedenou 
methodu odhadovou; proto též hodnota této statistiky, pokud jde o spo- 
lehlivost, nemůže se i‘ovnati statistickým šetřením skutečným. Jiný pří- 
klad použití této methody jest odhad hodnoty zahraničního obchodu 
(tam kde není zavedena methoda přímého zjišťování této hodnoty, t. zv. 
luethoda deklarační, jako jest tomu u nás), při kterém průměrné hodnoty 
jednotlivých druhů zboží získané odhadem se násobí množstvím doveze- 
ného a vyvezeného zboží, zjištěným statistickým šetřením zahraniěního 
obchodu. 


Anketa. 

Anketou (z francouzského enquéte = vyšetřování) nazývá se šetření, 
které se snaží objasni ti některou otázku dobrými zdáními (expertisami), 
vyžádanými od odborníků, znalců a zájemců o tuto otázku. Anketa má 
ovšem ráz subjektivní, poněvadž tlumočí osobní mínění a názory účast- 
níků. Výsledlvy ankety neposkytují obvykle materiál, který by bylo vy- 
jfjádřiti číselně ve formě ve statistice obvyklé. Anketa se však podobá 
statistickému šetření v tom, že se obrací na pokud možno vellíý okruh 
účastníků, aby se tak poznalo mínění převládající. Dobrá zdání účastníků 
mohou ovšem obsahovati statistický materiál, získaný jiným způsobem, 
na základě různých šetření, který pak pomáhá osvětliti problém, o Icterý 
při anketě jde. 

Ankety se pořádají nejčastěji pro řešení otázek hospodářských (na př. 
bytová anketa, měnová anketa), sociálních i kulturních. 

Jiné poinocué methody statistické. 

V nedostatku statistických údajů o nějakém souboru sahá se někdy 
ještě k jiným pomůckám, které mohou takový soubor osvětliti. Jsou to 
na př. údaje číselné, které se na soubor vztahují, ale nejsou výsledkem 
statistického šetření; tak kursovní lístky bursovní jsou důležitou pomůc- 
kou pro statistiku cenovou, různé číselné údaje a záznamy ve starých 
právních listinácJj jsou pomůckou pro historická bádání statistická. 

Podle své povahy jsou ceny zaznamenané na kursovních lístcích burs 
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cenných papírů nebo burs se zbožím obySejně nej Častější ceny, které se 
při bui’sovních obchodech vyskytly a byly zaznamenány. Rozdíl od sta- 
tistického šetření jest při tom ten, že nejsou všechny případy obchodů 
systematicky statisticky vyšetřovány, nýbrž že se zaznamenává jen určitý 
zlomek, který postačí k určení kursu; na binsách s cennými paphy bývají 
pak udávány na kursovních lístcích poslední ceny, za kterých obchody 
byly sjednány. Tyto nesystematické číselné záznamyy jak se takové údaje 
označují, slouží za základ ke statistice cenové, ačkoli nejde, jak bylo vy- 
líčeno, o pravé statistické šetření, 

U souborů skládajících se z jevů okamžitých, které nelze stále běžné 
statisticky zaznamenávati, a které vykazují stálý pohyb v obou směrech, 
přírůstek i úbytek, používá se t. zv. methody salda, t. j. určuje se rozdíl 
mezi dvěma časovými obdobími u tohoto souboru; na př. saldo vkladů 
uložených a vybraných za určité časové období ve spořitelnách nezjišťuje 
sice, kolik bylo průběhem tohoto období peněz uloženo a vybráno, alo 
zjišťuje rozdílem úhrnu na začátku a na konci tohoto období výsledek 
tohoto pohybu. Podobně se zjišťuje výsledek migrace v období mezi 
dvěma sčítáními lidu saldem pohybu migrace v tomto období. 

Konečně uvádí se jako zvláštní případ t. zv. šetření tabelární, při 
kterém se nedělají záznamy o jednotkách souboru, nýbrž přímo se tvoří 
skupiny a ty se zapisují s příslušnými údaji v tabulky již upravené. Tato 
niethoda má ten nedostatek, že údaje nelze již později kontrolovati, po^ 
kud jde o jednotlivé případy, ze kterých se skupiny skládají, ani jinak 
zpracovati, než jak již předem byly seskupeny. 

Velmi sporné je, zda lze k pomocným methodám statistickým za- 
lirnouti též methodu monografickou, jak ěLní někteří starší autoři, jako 
Mayr a Zižek. Při této metliodo se vybere ze souboru jediný typický pří- 
pad, kteiý se pak podrobně popíše a analysuje. Z výsledků této studie se 
pak usuzuje na celek. Z toho vyplývá jistá podoba této methody s metho- 
dou částečného šetření výběrem typických případů. Metliody této hojně 
se používá v sociologii (známé jsou studie Le Playovy Les ouvriers euro- 
péens Paříž 1855, ze které vzešel základ ke statistice domácích rozpočtů 
dále L^organisation de la famille, Paříž 1870). 

O všech pomocných methodách statistických platí, že jsou raetho- 
dami náhradními a že poskytují údaje méně spolehlivé nebo neúplné. 
Přes to, jak již bylo uvedeno, statistická praxe se nemůže bez nich obejiti. 
Při dalším zpracování a hodnocení takto získaného materiálu třeba však 
vždy na to pamatovati a neklásti jej na roveň údajům získaným přímým 
statistickým Setřením. 
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Seznam značek a symbolů v knize stále užívaných.'*') 


p značí theoretickou pravděpodobnost, žo nastane případ A 
q značí theoretickou pravděpodobnost, že nastane případ 5, protichůdný 
případu A 

— značí poměr pozorovaný clí případů vykazujících hledaný znak k celému 
pozorovanému souboru (čili empirickou pravděpodobnost neboli poměr- 
nou četnost) 

značí horizontální osu v grafickém znázornění a potom i znak, který un 
tuto osu nanášíme (na př, v korelační tabulce) 
y značí vertikální osu v grafickém znázorněni a potom i znak, který nu tuf o 
osu nanášíme 

Oq značí theoretickou střední odchylku 
<T značí směrodatnou (skutečnou) odchylku 
e značí základ přirozených logaritmů = 2'7182SI . . . 

.t značí Ludolfovo číslo = 3'14I592,.. 

.ii .rj a*., značí jednotlivé hodnoty (členy) souboru 
r značí počet hodnot souboru 
A a X značí aritmetický pinlměr 
2 značí součet 

/, /j/a značí Četnost (frekvenci) hodnot 

značí prozat.mní aritmetický průměr 

0 značí geometrický průměr 
H značí harmonický průměr 

Aq značí kvadratický průměr 
Mé a íř značí medián 

1 značí indoxní číslo 

J značí interval (rozpětí) třídy 
Qi Qi značí kvartil prvni a třetí 
Mq značí modus 
& značí průměrnou odchylku 

^ značí odchylku jednotlivých členů souboru od aritmetického průměru 
souboru 

Iq značí odchylku kvartilů 
V značí koeficient disperse (variability) 

Q značí divorgenční koeficient Lexisův 
6 značí průměr serie 

značí koeficient asociace (Yule-ův) 
r značí koeficient korelace (Pearsonův) 

značí theoretickou odchylku aritmetického průměru 
značí theoretickou odchylku rozdílu 
Oj. značí theoretickou odchylku Pearsonova koeficientu korelace 
t] značí korelační poměr 
značí test Peai sonův. 

*) Označeni použitá v některých zvláštních vzorcích, která jsou na příslušném 
místě vysvětlena a více se neopakují, nejsou v tomto seznamu obsažena. 
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